This repository contains scripts that process the Wiktionary dump data. Wiktionary tools Wiktionaryから特定の言語を抽出 python/tools collecting English irregular verbs Wiktionaryで英語の不規則動詞を調査 python/en-verb/ XML tag checker XMLのタグの構造と出現数を調べる fsharp/CheckTag.fsx dump viewer Wikipediaのダンプからページを取り出す python/etc/conv_index.py python/etc/mediawiki.py SQL dump to TSV converter MySQLのダンプをTSVに変換するスクリプトを書く sql2tsv/ research for parse texts Wiktionaryの効率的な処理方法を探る python/research/ Wiktionaryの全文処理をF#とPythonで速度比較 fsharp/research/