Update README_ja.md with latest information

shirochan · shirochan · commit a4d9349bcb47 · 2025-07-15T15:59:57.000+09:00
- Update GAIA benchmark score from 58.18 to 69.09
- Update paper link to new arXiv publication (2505.23885)
- Add latest news and updates from 2025
- Add installation prerequisites section
- Update experiment section to gaia69 branch
- Add MCP SSE example information
- Update citation with new paper details
- Add experiment FAQ section
- Update community image to community_code.jpeg
- Sync with English README.md for consistency
diff --git a/README_ja.md b/README_ja.md
@@ -136,7 +136,29 @@ https://private-user-images.githubusercontent.com/55657767/420212194-e813fc05-13
 
 # 🛠️ インストール
 
-OWLは、ワークフロープリファレンスに合わせた複数のインストール方法をサポートしています。最適なオプションを選択してください。
+## **前提条件**
+
+### Pythonのインストール
+OWLをインストールする前に、Pythonがインストールされていることを確認してください（バージョン3.10、3.11、または3.12がサポートされています）：
+
+> **GAIAベンチマークユーザー向けの注意**：GAIAベンチマーク評価を実行する場合は、`owl/camel`ディレクトリに標準CAMELインストールと比較してGAIAベンチマーク用に最適化された安定性向上ツールキットを含むCAMELフレームワークのカスタマイズバージョンが含まれている`gaia69`ブランチを使用してください。
+
+```bash
+# Pythonがインストールされているかチェック
+python --version
+
+# インストールされていない場合は、https://www.python.org/downloads/からダウンロードしてインストール
+# Homebrewを使用しているmacOSユーザーの場合：
+brew install python@3.10
+
+# Ubuntu/Debianの場合：
+sudo apt update
+sudo apt install python3.10 python3.10-venv python3-pip
+```
+
+## **インストールオプション**
+
+OWLは、ワークフロープリファレンスに合わせた複数のインストール方法をサポートしています。
 
 ## オプション1：uvを使用する（推奨）
 
@@ -443,7 +465,9 @@ npm install -g @executeautomation/playwright-mcp-server
 npx playwright install-deps
 ```
 
-`examples/run_mcp.py`の包括的なMCP例を試して、これらの機能を実際に体験してください！
+私たちの包括的なMCP例を試してみてください：
+- `examples/run_mcp.py` - 基本的なMCP機能デモンストレーション（ローカル呼び出し、依存関係が必要）
+- `examples/run_mcp_sse.py` - SSEプロトコルを使用した例（リモートサービスを使用、依存関係不要）
 
 ## 利用可能なツールキット
 
@@ -611,7 +635,7 @@ OWLのGAIAベンチマークスコア58.18を再現するには：
 
 さらなる議論に参加してください！
 <!-- ![](./assets/community.png) -->
-![](./assets/community.jpeg)
+![](./assets/community_code.jpeg)
 
 # ❓ FAQ
 
@@ -627,6 +651,16 @@ A: OWLはPython 3.10、3.11、および3.12をサポートしています。
 
 A: 参加方法の詳細については、[貢献](#-貢献)セクションを参照してください。コードの改善からドキュメントの更新まで、あらゆる種類の貢献を歓迎します。
 
+## 実験の質問
+
+**Q: どのCAMELバージョンを使用してロールプレイングの結果を複製すべきですか？**
+
+A: gaia69ブランチで修正されたCAMELバージョン（owl/camel）を提供しています。実験にはこのCAMELバージョンを使用してください。
+
+**Q: なぜ実験結果が報告された数値よりも低いのですか？**
+
+A: GAIAベンチマークは現実世界でLLMエージェントを評価するため、大きなランダム性が導入されます。ユーザーのフィードバックに基づくと、複製において最も一般的な問題の一つは、例えば、ネットワークの理由で特定のウェブページでエージェントがブロックされることです。これらのエラーを迅速にフィルタリングするためのキーワードマッチングスクリプトを[こちら](https://github.com/camel-ai/owl/blob/gaia58.18/owl/filter_failed_cases.py)にアップロードしました。現実的なオープンワールド環境でLLMエージェントを評価する際の詳細については、この[技術報告書](https://hypnotic-mind-6bd.notion.site/OWL-Optimized-Workforce-Learning-for-General-Multi-Agent-Assistance-in-Real-World-Task-Automation-1d4004aeb21380158749c7f84b20643f?pvs=74)も確認できます。
+
 # 📚 CAMEL依存関係の探索
 
 OWLは[CAMEL](https://github.com/camel-ai/camel)フレームワークの上に構築されています。以下は、CAMELのソースコードを探索し、OWLとの連携方法を理解する方法です：