Fix bug in zettair indexing script which prevented indexing the live site
[ndcode_site.git] / _zet / index.sh
1 #!/bin/sh
2
3 if test $# -lt 1
4 then
5   url=http://localhost:8080
6 else
7   url="$1"
8 fi
9   
10 rm -rf site.*
11
12 mkdir site.dir
13 wget -r -l inf --accept=.html --directory-prefix=site.dir --no-host-directories $url
14
15 for i in `find site.dir -type f`
16 do
17   echo -n $i |sed -e 's/^site\.dir\(.*\)/<DOC><DOCNO>\1<\/DOCNO>/'
18   recode --diacritics UTF-8..HTML <$i
19   echo -n '</DOC>'
20 done >site.txt
21
22 zet -f site -i site.txt