首先,感谢你对 Karotte oder Nein 的贡献!
使用 Bun 作为构建工具:
bun install
bun run dev项目使用本地 raw-data/lemma_keys.all.tsv(词频顺序)和 Kaikki 的 de-extract.jsonl(词性 source-of-truth)生成前 10000 个名词数据。
-
注册账号并同意协议,下载 DeReKoGram 中的:
lemma_keys.all.tsv
-
从 Kaikki 下载德语词典抽取文件并放到
raw-data/de-extract.jsonl# 可直接从 https://kaikki.org/dictionary/rawdata.html 下载 -
生成数据库
bun run data:build
生成结果:
app/assets/data.sqliteapp/assets/data.meta.txt