- Staatsbibliothek zu Berlin
- Bayerische Staatsbibliothek / Münchener Digitalisierungszentrum
- Universitäts- und Landesbibliothek Darmstadt
- Herzog August Bibliothek Wolfenbüttel
- Thüringer Universitäts- und Landesbibliothek
- Universitäts- und Stadtbibliothek Köln
- Universitäts- und Landesbibliothek Düsseldorf
- Hochschulbibliothek Fachhochschule Potsdam
- MARCHIVUM Mannheim
# Remove empty lines from ALTO and PAGE XML.
perl -i -ne "tr|\r||d; next if /^\s*$/;print" *.xml
# Remove ALTO files without fulltext.
rm -f $(grep -L 'CONTENT="..*"' *.xml)
# Remove PAGE files without fulltext.
rm -f $(grep -L '<Unicode>..*</Unicode>' *.xml)