GitHub - ku-nlp/latent_language_of_multilingual_model: Partial code for the arXiv paper 'Beyond English-Centric LLMs: What Language Do Multilingual Language Models Think in?'

Usage

You may need to add a Hugging Face token to Translation.ipynb and Cloze_multi.ipynb if you want to access certain models.

Translation

papermill Translation.ipynb out.ipynb -p input_lang en -p latent_lang_1 en -p latent_lang_2 ja -p target_lang zh -p model_selected 3 -p layer_num 40

Cloze

papermill Cloze_multi.ipynb out.ipynb -p latent_lang_1 en -p latent_lang_2 ja -p target_lang ja -p model_selected 3 -p layer_num 40

Set the appropriate layer_num based on the model you are using (e.g., 40 for Llama-13b).

Acknowledgements

The llamawrapper.py script is adapted from the work of wendlerc. We thank them for their valuable contribution.

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
Cloze_multi.ipynb		Cloze_multi.ipynb
README.md		README.md
Translation.ipynb		Translation.ipynb
llamawrapper.py		llamawrapper.py
multi5.csv		multi5.csv
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Usage

Translation

Cloze

Acknowledgements

About

Uh oh!

Releases

Packages

Uh oh!

Languages

ku-nlp/latent_language_of_multilingual_model

Folders and files

Latest commit

History

Repository files navigation

Usage

Translation

Cloze

Acknowledgements

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages