Introduction au projet (Essayez la version en ligne maintenant !)
KrillinAI est une solution polyvalente de localisation et d'amélioration audio et vidéo développée par Krillin AI. Cet outil minimaliste mais puissant intègre la traduction vidéo, le doublage et le clonage vocal, prenant en charge les formats paysage et portrait pour garantir une présentation parfaite sur toutes les principales plateformes (Bilibili, Xiaohongshu, Douyin, WeChat Video, Kuaishou, YouTube, TikTok, etc.). Avec un flux de travail de bout en bout, vous pouvez transformer des matériaux bruts en contenu prêt à l'emploi et multiplateforme en quelques clics.
🎯 Démarrage en un clic : Pas de configuration d'environnement complexe requise, installation automatique des dépendances, prêt à l'emploi immédiatement, avec une nouvelle version de bureau pour un accès plus facile !
📥 Acquisition vidéo : Prend en charge les téléchargements yt-dlp ou les téléchargements de fichiers locaux
📜 Reconnaissance précise : Reconnaissance vocale de haute précision basée sur Whisper
🧠 Segmentation intelligente : Segmentation et alignement des sous-titres utilisant LLM
🔄 Remplacement de terminologie : Remplacement en un clic du vocabulaire professionnel
🌍 Traduction professionnelle : Traduction LLM avec contexte pour maintenir une sémantique naturelle
🎙️ Clonage vocal : Offre des tons de voix sélectionnés de CosyVoice ou un clonage vocal personnalisé
🎬 Composition vidéo : Traite automatiquement les vidéos paysage et portrait ainsi que la mise en page des sous-titres
💻 Multiplateforme : Prend en charge Windows, Linux, macOS, fournissant à la fois des versions de bureau et serveur
L'image ci-dessous montre l'effet du fichier de sous-titres généré après l'importation d'une vidéo locale de 46 minutes et son exécution en un clic, sans aucun ajustement manuel. Il n'y a pas d'omissions ni de chevauchements, la segmentation est naturelle et la qualité de la traduction est très élevée.

subtitle_translation.mp4 |
tts.mp4 |
agi.mp4 |
Tous les modèles locaux dans le tableau ci-dessous prennent en charge l'installation automatique des fichiers exécutables + fichiers de modèle ; vous n'avez qu'à choisir, et Klic préparera tout pour vous.
| Source de service | Plateformes prises en charge | Options de modèle | Local/Cloud | Remarques |
|---|---|---|---|---|
| OpenAI Whisper | Toutes les plateformes | - | Cloud | Vitesse rapide et bon effet |
| FasterWhisper | Windows/Linux | tiny/medium/large-v2 (recommandé medium+) |
Local | Vitesse plus rapide, pas de coût de service cloud |
| WhisperKit | macOS (M-series uniquement) | large-v2 |
Local | Optimisation native pour les puces Apple |
| WhisperCpp | Toutes les plateformes | large-v2 |
Local | Prend en charge toutes les plateformes |
| Alibaba Cloud ASR | Toutes les plateformes | - | Cloud | Évite les problèmes de réseau en Chine continentale |
✅ Compatible avec tous les services de grands modèles de langage cloud/local conformes aux spécifications de l'API OpenAI, y compris mais sans s'y limiter :
- OpenAI
- Gemini
- DeepSeek
- Tongyi Qianwen
- Modèles open-source déployés localement
- Autres services API compatibles avec le format OpenAI
- Service vocal Alibaba Cloud
- OpenAI TTS
Langues d'entrée prises en charge : chinois, anglais, japonais, allemand, turc, coréen, russe, malais (augmentation continue)
Langues de traduction prises en charge : anglais, chinois, russe, espagnol, français et 101 autres langues
Vous pouvez poser des questions sur le Deepwiki de KrillinAI. Il indexe les fichiers dans le dépôt, vous pouvez donc trouver des réponses rapidement.
Tout d'abord, téléchargez le fichier exécutable qui correspond à votre système de périphérique depuis le Release, puis suivez le tutoriel ci-dessous pour choisir entre la version de bureau ou la version non de bureau. Placez le téléchargement du logiciel dans un dossier vide, car son exécution générera certains répertoires, et le garder dans un dossier vide facilitera la gestion.
【Si c'est la version de bureau, c'est-à-dire le fichier de version avec "desktop", voir ici】 La version de bureau est nouvellement publiée pour résoudre les problèmes des nouveaux utilisateurs qui ont du mal à éditer correctement les fichiers de configuration, et il y a quelques bugs qui sont continuellement mis à jour.
- Double-cliquez sur le fichier pour commencer à l'utiliser (la version de bureau nécessite également une configuration au sein du logiciel)
【Si c'est la version non de bureau, c'est-à-dire le fichier de version sans "desktop", voir ici】 La version non de bureau est la version initiale, qui a une configuration plus complexe mais est stable en fonctionnalité et convient au déploiement sur serveur, car elle fournit une interface utilisateur au format web.
- Créez un dossier
configdans le dossier, puis créez un fichierconfig.tomldans le dossierconfig. Copiez le contenu du fichierconfig-example.tomldu répertoireconfigdu code source dansconfig.toml, et remplissez vos informations de configuration selon les commentaires. - Double-cliquez ou exécutez le fichier exécutable dans le terminal pour démarrer le service
- Ouvrez votre navigateur et entrez
http://127.0.0.1:8888pour commencer à l'utiliser (remplacez 8888 par le port que vous avez spécifié dans le fichier de configuration)
【Si c'est la version de bureau, c'est-à-dire le fichier de version avec "desktop", voir ici】 En raison de problèmes de signature, la version de bureau ne peut actuellement pas être exécutée par double-clic ou installée via dmg ; vous devez faire confiance manuellement à l'application. La méthode est la suivante :
- Ouvrez le terminal dans le répertoire où se trouve le fichier exécutable (en supposant que le nom du fichier est KrillinAI_1.0.0_desktop_macOS_arm64)
- Exécutez les commandes suivantes dans l'ordre :
sudo xattr -cr ./KrillinAI_1.0.0_desktop_macOS_arm64
sudo chmod +x ./KrillinAI_1.0.0_desktop_macOS_arm64
./KrillinAI_1.0.0_desktop_macOS_arm64
【Si c'est la version non de bureau, c'est-à-dire le fichier de version sans "desktop", voir ici】 Ce logiciel n'est pas signé, donc lors de l'exécution sur macOS, après avoir terminé la configuration du fichier dans les "Étapes de base", vous devez également faire confiance manuellement à l'application. La méthode est la suivante :
-
Ouvrez le terminal dans le répertoire où se trouve le fichier exécutable (en supposant que le nom du fichier est KrillinAI_1.0.0_macOS_arm64)
-
Exécutez les commandes suivantes dans l'ordre :
sudo xattr -rd com.apple.quarantine ./KrillinAI_1.0.0_macOS_arm64 sudo chmod +x ./KrillinAI_1.0.0_macOS_arm64 ./KrillinAI_1.0.0_macOS_arm64Cela démarrera le service
Ce projet prend en charge le déploiement Docker ; veuillez vous référer aux Instructions de déploiement Docker
Basé sur le fichier de configuration fourni, voici la section mise à jour "Aide à la configuration (À lire absolument)" pour votre fichier README :
Le fichier de configuration est divisé en plusieurs sections : [app], [server], [llm], [transcribe], et [tts]. Une tâche est composée de reconnaissance vocale (transcribe) + traduction de grand modèle (llm) + services vocaux optionnels (tts). Comprendre cela vous aidera à mieux saisir le fichier de configuration.
Configuration la plus facile et rapide :
Pour la traduction de sous-titres uniquement :
- Dans la section
[transcribe], définissezprovider.namesuropenai. - Vous n'aurez alors qu'à remplir votre clé API OpenAI dans le bloc
[llm]pour commencer à effectuer des traductions de sous-titres. Les champsapp.proxy,model, etopenai.base_urlpeuvent être remplis selon les besoins.
Coût, vitesse et qualité équilibrés (Utilisation de la reconnaissance vocale locale) :
- Dans la section
[transcribe], définissezprovider.namesurfasterwhisper. - Définissez
transcribe.fasterwhisper.modelsurlarge-v2. - Remplissez votre configuration de grand modèle de langage dans le bloc
[llm]. - Le modèle local requis sera automatiquement téléchargé et installé.
Configuration TTS (Texte à Parole) (Optionnel) :
- La configuration TTS est optionnelle.
- Tout d'abord, définissez
provider.namesous la section[tts](par exemple,aliyunouopenai). - Ensuite, remplissez le bloc de configuration correspondant pour le fournisseur sélectionné. Par exemple, si vous choisissez
aliyun, vous devez remplir la section[tts.aliyun]. - Les codes vocaux dans l'interface utilisateur doivent être choisis en fonction de la documentation du fournisseur sélectionné.
- Remarque : Si vous prévoyez d'utiliser la fonction de clonage vocal, vous devez sélectionner
aliyuncomme fournisseur TTS.
Configuration Alibaba Cloud :
- Pour des détails sur l'obtention des
AccessKey,Bucket, etAppKeynécessaires pour les services Alibaba Cloud, veuillez vous référer aux Instructions de configuration Alibaba Cloud. Les champs répétés pour AccessKey, etc., sont conçus pour maintenir une structure de configuration claire.
Veuillez visiter Questions Fréquemment Posées
- Ne soumettez pas de fichiers inutiles, tels que .vscode, .idea, etc. ; veuillez utiliser .gitignore pour les filtrer.
- Ne soumettez pas config.toml ; soumettez plutôt config-example.toml.
- Rejoignez notre groupe QQ pour des questions : 754069680
- Suivez nos comptes de médias sociaux, Bilibili, où nous partageons chaque jour du contenu de qualité dans le domaine de la technologie AI.


