Skip to content

Commit a4d9349

Browse files
committed
Update README_ja.md with latest information
- Update GAIA benchmark score from 58.18 to 69.09 - Update paper link to new arXiv publication (2505.23885) - Add latest news and updates from 2025 - Add installation prerequisites section - Update experiment section to gaia69 branch - Add MCP SSE example information - Update citation with new paper details - Add experiment FAQ section - Update community image to community_code.jpeg - Sync with English README.md for consistency
1 parent 1f7882c commit a4d9349

File tree

1 file changed

+37
-3
lines changed

1 file changed

+37
-3
lines changed

README_ja.md

Lines changed: 37 additions & 3 deletions
Original file line numberDiff line numberDiff line change
@@ -136,7 +136,29 @@ https://private-user-images.githubusercontent.com/55657767/420212194-e813fc05-13
136136

137137
# 🛠️ インストール
138138

139-
OWLは、ワークフロープリファレンスに合わせた複数のインストール方法をサポートしています。最適なオプションを選択してください。
139+
## **前提条件**
140+
141+
### Pythonのインストール
142+
OWLをインストールする前に、Pythonがインストールされていることを確認してください(バージョン3.10、3.11、または3.12がサポートされています):
143+
144+
> **GAIAベンチマークユーザー向けの注意**:GAIAベンチマーク評価を実行する場合は、`owl/camel`ディレクトリに標準CAMELインストールと比較してGAIAベンチマーク用に最適化された安定性向上ツールキットを含むCAMELフレームワークのカスタマイズバージョンが含まれている`gaia69`ブランチを使用してください。
145+
146+
```bash
147+
# Pythonがインストールされているかチェック
148+
python --version
149+
150+
# インストールされていない場合は、https://www.python.org/downloads/からダウンロードしてインストール
151+
# Homebrewを使用しているmacOSユーザーの場合:
152+
brew install [email protected]
153+
154+
# Ubuntu/Debianの場合:
155+
sudo apt update
156+
sudo apt install python3.10 python3.10-venv python3-pip
157+
```
158+
159+
## **インストールオプション**
160+
161+
OWLは、ワークフロープリファレンスに合わせた複数のインストール方法をサポートしています。
140162

141163
## オプション1:uvを使用する(推奨)
142164

@@ -443,7 +465,9 @@ npm install -g @executeautomation/playwright-mcp-server
443465
npx playwright install-deps
444466
```
445467

446-
`examples/run_mcp.py`の包括的なMCP例を試して、これらの機能を実際に体験してください!
468+
私たちの包括的なMCP例を試してみてください:
469+
- `examples/run_mcp.py` - 基本的なMCP機能デモンストレーション(ローカル呼び出し、依存関係が必要)
470+
- `examples/run_mcp_sse.py` - SSEプロトコルを使用した例(リモートサービスを使用、依存関係不要)
447471

448472
## 利用可能なツールキット
449473

@@ -611,7 +635,7 @@ OWLのGAIAベンチマークスコア58.18を再現するには:
611635

612636
さらなる議論に参加してください!
613637
<!-- ![](./assets/community.png) -->
614-
![](./assets/community.jpeg)
638+
![](./assets/community_code.jpeg)
615639

616640
# ❓ FAQ
617641

@@ -627,6 +651,16 @@ A: OWLはPython 3.10、3.11、および3.12をサポートしています。
627651

628652
A: 参加方法の詳細については、[貢献](#-貢献)セクションを参照してください。コードの改善からドキュメントの更新まで、あらゆる種類の貢献を歓迎します。
629653

654+
## 実験の質問
655+
656+
**Q: どのCAMELバージョンを使用してロールプレイングの結果を複製すべきですか?**
657+
658+
A: gaia69ブランチで修正されたCAMELバージョン(owl/camel)を提供しています。実験にはこのCAMELバージョンを使用してください。
659+
660+
**Q: なぜ実験結果が報告された数値よりも低いのですか?**
661+
662+
A: GAIAベンチマークは現実世界でLLMエージェントを評価するため、大きなランダム性が導入されます。ユーザーのフィードバックに基づくと、複製において最も一般的な問題の一つは、例えば、ネットワークの理由で特定のウェブページでエージェントがブロックされることです。これらのエラーを迅速にフィルタリングするためのキーワードマッチングスクリプトを[こちら](https://github.com/camel-ai/owl/blob/gaia58.18/owl/filter_failed_cases.py)にアップロードしました。現実的なオープンワールド環境でLLMエージェントを評価する際の詳細については、この[技術報告書](https://hypnotic-mind-6bd.notion.site/OWL-Optimized-Workforce-Learning-for-General-Multi-Agent-Assistance-in-Real-World-Task-Automation-1d4004aeb21380158749c7f84b20643f?pvs=74)も確認できます。
663+
630664
# 📚 CAMEL依存関係の探索
631665

632666
OWLは[CAMEL](https://github.com/camel-ai/camel)フレームワークの上に構築されています。以下は、CAMELのソースコードを探索し、OWLとの連携方法を理解する方法です:

0 commit comments

Comments
 (0)