Skip to content

MasanoriYamada/claude-paper

Repository files navigation

論文翻訳システム (Paper Translation System)

学術論文を英語から日本語に高品質で翻訳するための包括的なシステムです。LaTeX数式、高品質な図表、学術的な専門用語を適切に処理し、完全な翻訳を保証します。

🌟 特徴

  • 完全翻訳保証: セクション毎の検証により100%完了を確保
  • 高品質図表: Allen Institute pdffigures2による学術グレードの図表抽出
  • LaTeX数式対応: 数式の正確な翻訳とフォーマット保持
  • コンテキスト統合: 図表を関連テキストの直後に配置
  • 学術専門用語: 技術用語の一貫した翻訳
  • 整理された出力: results/ディレクトリでの清潔な管理

🚀 必要環境

Claude Code (必須)

重要: このシステムはClaude Codeでのみ動作します。

Claude Codeのインストール:

# macOS 
npm install -g @anthropic-ai/claude-code

Claude Codeについて詳しくは: https://docs.anthropic.com/claude-code

その他の必要ソフトウェア

  • Java 8+: pdffigures2実行のため

    # macOS
    brew install openjdk@11
    
    # Ubuntu/Debian
    sudo apt-get install openjdk-11-jdk
  • Python 3.13+: uvによって自動管理

📦 インストール

1. リポジトリのクローン

git clone https://github.com/MasanoriYamada/claude-paper.git
cd claude-paper

2. 依存関係のインストール

# uvがPython環境と依存関係を自動管理
uv sync

🔧 使い方

基本的な使用方法

  1. プロジェクトディレクトリに移動:

    cd /path/to/claude-paper
  2. Claude Codeを起動:

    claude
  3. PDFファイルパスを提供して翻訳を依頼:

    /Users/yamada/Downloads/2504.16084v1.pdf を翻訳して
    

セクション比較ビューア

翻訳完了後、原文PDFと翻訳結果を並べて表示・比較できるWebインターフェースが利用できます:

section_viewer.pyを起動して

Claude Codeに上記のように依頼すると、自動的にローカルサーバーが起動し、ブラウザが開きます。

機能:

  • 📄 原文PDF表示(ズーム機能付き)
  • 📝 翻訳結果表示(図表込み)
  • 🔗 セクション間の自動同期
  • 🎯 ダブルクリックで対応セクションにジャンプ

開いたブラウザ画面でPDFとMarkdownファイルを選択して比較表示できます。

自動翻訳プロセス

Claude Codeが以下を自動実行:

  1. テキスト抽出: PDFからテキストを抽出
  2. 構造分析: 論文のセクション構造を識別
  3. 図表抽出: pdffigures2で高品質図表を抽出
  4. プロジェクト作成: results/ディレクトリ下に組織化
  5. セクション毎翻訳: 各セクションを順次翻訳、進捗をトラッキング
  6. 品質検証: 完了前に全セクションの翻訳を確認
  7. 最終調整: 中間ファイルの削除とプロジェクトの整理

📁 出力構造

results/
└── Paper_Title/
    ├── README.md           # 完全翻訳された論文(図表埋め込み済み)
    └── figures/
        └── pdffigures2_official/
            ├── figure1.png  # 高品質図表(300 DPI)
            ├── figure2.png
            ├── table1.png
            └── table2.png

📋 翻訳品質基準

学術的正確性

  • 技術用語の一貫した翻訳
  • 研究概念の適切な日本語表現
  • 学術論文としての文体維持

数式処理

  • LaTeX形式の保持: $\theta \in \Theta$ (インライン)
  • 複雑数式: $$\sum_{i=1}^{n} x_i \tag{1}$$ (ディスプレイ)
  • 数式番号と参照の保持

図表統合

  • コンテキスト内配置(文書末尾ではない)
  • プロフェッショナルなスタイリング
  • 日本語キャプション翻訳
  • 高解像度品質(300 DPI)

✅ 完了検証

翻訳完了前に以下を確認:

  • 全セクションが翻訳済み
  • チェックリストが100%完了
  • プレースホルダーテキストが残っていない
  • 全図表がコンテキスト内に配置
  • 数式が正しくLaTeX形式
  • References セクションが含まれている

🛠 トラブルシューティング

よくある問題

Java環境エラー: 「Unable to locate a Java Runtime」エラーが発生した場合:

# Java インストールの確認
brew list | grep openjdk

# Javaがインストールされていない場合
brew install openjdk@11

# Java環境の設定
export JAVA_HOME="/opt/homebrew/opt/openjdk@11"
export PATH="$JAVA_HOME/bin:$PATH"
java -version  # Java 11以上であることを確認

# 永続的な設定(オプション)
echo 'export JAVA_HOME="/opt/homebrew/opt/openjdk@11"' >> ~/.zshrc
echo 'export PATH="$JAVA_HOME/bin:$PATH"' >> ~/.zshrc
source ~/.zshrc

pdffigures2が見つからない:

  • pdffigures2/pdffigures2.jarが存在することを確認
  • Javaバージョンが8以上であることを確認

Claude Code以外での実行:

  • このシステムはClaude Code専用です
  • 通常のClaude WebやAPIでは動作しません

サポート

問題が発生した場合は、以下の情報とともにissueを作成してください:

  • Claude Codeのバージョン
  • Java環境の詳細 (which javajava -version)
  • エラーメッセージの全文
  • 使用したPDFファイルの種類

📄 ライセンス

このプロジェクトは学術研究目的で使用されることを想定しています。Allen Institute pdffigures2のライセンス条項に従ってください。

🤝 貢献

プルリクエストや改善提案を歓迎します。特に以下の領域での貢献を募集しています:

  • 翻訳品質の向上
  • 新しい学術分野への対応
  • 処理速度の最適化
  • ユーザビリティの改善

📝 Change Log

  • 2026-02-15: 複数の論文の同時翻訳に対応。抽出テキスト・図表の出力先をプロジェクトディレクトリ (results/{paper_title}/) に統一し、並列実行時のファイル競合を解消。

注意: このシステムは学術論文の翻訳を支援するツールです。最終的な翻訳品質については人間による確認をお勧めします。

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors