Skip to content

stuser/Awesome_TC_Datasets

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

85 Commits
 
 

Repository files navigation

Awesome Traditional Chinese Datasets

Awesome Traditional Chinese Datasets: 我們收集有關繁體中文資料集資訊,將它們整理成清單,以利開源社群同好方便找尋及運用。

繁體中文資料集

來源自 Huggingace 🤗

一些HF平台上的繁體中文資料集: (按住 Ctrl + 點擊⌘ + 點擊 在新分頁開啟)

推理資料集

🤗 Twinkle AI 繁體中文推理:

  1. 👩‍🏫數理推理 - MIT License : twinkle-ai/tw-math-reasoning-2k
  2. 🇹🇼日常推理 - MIT License : twinkle-ai/tw-reasoning-instruct-50k
  3. 🛠Function Calling - Creative Commons Attribution 4.0 License : twinkle-ai/tw-function-call-reasoning-10k

台語文本資料集

台語文本資料集,目前主要來自作家胡長松老師的臉書文章,轉貼整理如下。 IMA Taiwan Tongues專案新建且已經公開的語料庫:(https://huggingface.co/IMA-Taiwan)

來源自-Github :octocat:

一些github平台上的繁體中文資料集:

其它來源

一些相關中文資料集:

簡體中文資料集:

模型驗證手法

有關模型驗證的方法參考:

相關工具

資料集社群

有關繁體中文資料集社群:

About

Awesome Traditional Chinese Datasets

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •