Avoid %links accumulating duplicates. (For TOVA)
authorJoey Hess <joey@gnu.kitenet.net>
Wed, 6 May 2009 03:40:09 +0000 (23:40 -0400)
committerJoey Hess <joey@gnu.kitenet.net>
Wed, 6 May 2009 04:27:24 +0000 (00:27 -0400)
commit2a7721febd6cac1af5e7f4b4949ffe066c62c837
treec0e488da71e36ce1842e2553e2cf683e49d15676
parent1c7c9e95f227a3ff7906c000ec15bb163edc463f
Avoid %links accumulating duplicates. (For TOVA)

This is sorta an optimisation, and sorta a bug fix. In one
test case I have available, it can speed a page build up from 3
minutes to 3 seconds.

The root of the problem is that $links{$page} contains arrays of
links, rather than hashes of links. And when a link is found,
it is just pushed onto the array, without checking for dups.

Now, the array is emptied before scanning a page, so there
should not be a lot of opportunity for lots of duplicate links
to pile up in it. But, in some cases, they can, and if there
are hundreds of duplicate links in the array, then scanning it
for matching links, as match_link and some other code does,
becomes much more expensive than it needs to be.

Perhaps the real right fix would be to change the data structure
to a hash. But, the list of links is never accessed like that,
you always want to iterate through it.

I also looked at deduping the list in saveindex, but that does
a lot of unnecessary work, and doesn't completly solve the problem.

So, finally, I decided to add an add_link function that handles deduping,
and make ikiwiki-transition remove the old dup links.
IkiWiki.pm
IkiWiki/Plugin/camelcase.pm
IkiWiki/Plugin/img.pm
IkiWiki/Plugin/link.pm
IkiWiki/Plugin/meta.pm
IkiWiki/Plugin/tag.pm
debian/NEWS
debian/changelog
doc/ikiwiki-transition.mdwn
doc/plugins/write.mdwn
ikiwiki-transition