2828[ コミュニティ] ( https://github.com/camel-ai/owl#community ) |
2929[ インストール] ( #️-installation ) |
3030[ 例] ( https://github.com/camel-ai/owl/tree/main/owl ) |
31- [ 論文] ( https://arxiv.org/abs/2303.17760 ) |
31+ [ 論文] ( https://arxiv.org/abs/2505.23885 ) |
3232[ 引用] ( https://github.com/camel-ai/owl#citation ) |
3333[ 貢献] ( https://github.com/camel-ai/owl/graphs/contributors ) |
3434[ CAMEL-AI] ( https://www.camel-ai.org/ )
3737
3838<div align =" center " style =" background-color : #f0f7ff ; padding : 10px ; border-radius : 5px ; margin : 15px 0 ;" >
3939 <h3 style =" color : #1e88e5 ; margin : 0 ;" >
40- 🏆 OWLはGAIAベンチマークで<span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">58.18 </span>の平均スコアを達成し、オープンソースフレームワークの中で<span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">🏅️ #1</span>にランクインしました! 🏆
40+ 🏆 OWLはGAIAベンチマークで<span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">69.09 </span>の平均スコアを達成し、オープンソースフレームワークの中で<span style="color: #d81b60; font-weight: bold; font-size: 1.2em;">🏅️ #1</span>にランクインしました! 🏆
4141 </h3 >
4242</div >
4343
108108 </p >
109109</div >
110110
111+ - ** [ 2025.05.27] ** : OWLの技術報告書を公開しました。労働力(フレームワーク)と最適化労働力学習(訓練手法)についての詳細が含まれています。[ 論文] ( https://arxiv.org/abs/2505.23885 ) 。
112+ - ** [ 2025.05.18] ** : GAIAでの労働力実験を複製するための初期バージョンを[ こちら] ( https://github.com/camel-ai/owl/tree/gaia69 ) でオープンソース化しました。
113+ - ** [ 2025.04.18] ** : OWLの新しいGAIAベンチマークスコア** 69.09%** をアップロードし、オープンソースフレームワークの中で#1 にランクインしました。技術報告書は[ こちら] ( https://hypnotic-mind-6bd.notion.site/OWL-Optimized-Workforce-Learning-for-General-Multi-Agent-Assistance-in-Real-World-Task-Automation-1d4004aeb21380158749c7f84b20643f ) をご覧ください。
114+ - ** [ 2025.03.27] ** : SearxNG検索エンジンを使用したウェブ検索を実行するSearxNGToolkitを統合。
115+ - ** [ 2025.03.26] ** : "chrome"、"msedge"、"chromium"チャンネルのマルチブラウザサポートでBrowser Toolkitを強化。
116+ - ** [ 2025.03.25] ** : Gemini 2.5 Proをサポート、実行例コードを追加
111117- ** [ 2025.03.21] ** : OpenRouterモデルプラットフォームを統合し、Geminiツール呼び出しのバグを修正
112118- ** [ 2025.03.20] ** : MCPツールキットにAcceptヘッダーを追加し、Playwrightの自動インストールをサポート
113119- ** [ 2025.03.16] ** : Bing検索、Baidu検索をサポート
@@ -136,7 +142,29 @@ https://private-user-images.githubusercontent.com/55657767/420212194-e813fc05-13
136142
137143# 🛠️ インストール
138144
139- OWLは、ワークフロープリファレンスに合わせた複数のインストール方法をサポートしています。最適なオプションを選択してください。
145+ ## ** 前提条件**
146+
147+ ### Pythonのインストール
148+ OWLをインストールする前に、Pythonがインストールされていることを確認してください(バージョン3.10、3.11、または3.12がサポートされています):
149+
150+ > ** GAIAベンチマークユーザー向けの注意** :GAIAベンチマーク評価を実行する場合は、` owl/camel ` ディレクトリに標準CAMELインストールと比較してGAIAベンチマーク用に最適化された安定性向上ツールキットを含むCAMELフレームワークのカスタマイズバージョンが含まれている` gaia69 ` ブランチを使用してください。
151+
152+ ``` bash
153+ # Pythonがインストールされているかチェック
154+ python --version
155+
156+ # インストールされていない場合は、https://www.python.org/downloads/からダウンロードしてインストール
157+ # Homebrewを使用しているmacOSユーザーの場合:
158+ 159+
160+ # Ubuntu/Debianの場合:
161+ sudo apt update
162+ sudo apt install python3.10 python3.10-venv python3-pip
163+ ```
164+
165+ ## ** インストールオプション**
166+
167+ OWLは、ワークフロープリファレンスに合わせた複数のインストール方法をサポートしています。
140168
141169## オプション1:uvを使用する(推奨)
142170
@@ -443,7 +471,9 @@ npm install -g @executeautomation/playwright-mcp-server
443471npx playwright install-deps
444472```
445473
446- ` examples/run_mcp.py ` の包括的なMCP例を試して、これらの機能を実際に体験してください!
474+ 私たちの包括的なMCP例を試してみてください:
475+ - ` examples/run_mcp.py ` - 基本的なMCP機能デモンストレーション(ローカル呼び出し、依存関係が必要)
476+ - ` examples/run_mcp_sse.py ` - SSEプロトコルを使用した例(リモートサービスを使用、依存関係不要)
447477
448478## 利用可能なツールキット
449479
@@ -544,16 +574,19 @@ python owl/webapp_jp.py
544574
545575# 🧪 実験
546576
547- OWLのGAIAベンチマークスコア58.18を再現するには:
577+ OWLのGAIAベンチマークスコアを再現するには:
578+ さらに、GAIAベンチマークでの最適なパフォーマンスを確保するために、` gaia69 ` ブランチには` owl/camel ` ディレクトリに標準のCAMELインストールと比較してGAIAベンチマーク用に最適化された、安定性が向上したツールキットを含むCAMELフレームワークのカスタマイズバージョンが含まれていることにご注意ください。
548579
549- 1 . ` gaia58.18 ` ブランチに切り替え:
580+ ベンチマーク評価を実行する際は:
581+
582+ 1 . ` gaia69 ` ブランチに切り替え:
550583 ``` bash
551- git checkout gaia58.18
584+ git checkout gaia69
552585 ```
553586
5545872 . 評価スクリプトを実行:
555588 ``` bash
556- python run_gaia_roleplaying .py
589+ python run_gaia_workforce_claude .py
557590 ```
558591
559592これにより、GAIAベンチマークでトップランクのパフォーマンスを達成したのと同じ構成が実行されます。
@@ -562,10 +595,10 @@ OWLのGAIAベンチマークスコア58.18を再現するには:
562595
563596私たちはOWLの改善に継続的に取り組んでいます。以下は私たちのロードマップです:
564597
565- - [ ] 現実のタスクにおけるマルチエージェント協力の探求と洞察を詳述する技術ブログ記事を書く
566- - [ ] 特定の分野のタスクに対応する専門ツールを追加してツールキットエコシステムを強化
567- - [ ] より高度なエージェント相互作用パターンと通信プロトコルを開発
568- - [ ] 複雑な多段階推論タスクのパフォーマンスを向上
598+ - [x ] 現実のタスクにおけるマルチエージェント協力の探求と洞察を詳述する技術ブログ記事を書く
599+ - [x ] 特定の分野のタスクに対応する専門ツールを追加してツールキットエコシステムを強化
600+ - [x ] より高度なエージェント相互作用パターンと通信プロトコルを開発
601+ - [x ] 複雑な多段階推論タスクのパフォーマンスを向上
569602
570603# 📄 ライセンス
571604
@@ -577,12 +610,14 @@ OWLのGAIAベンチマークスコア58.18を再現するには:
577610
578611
579612```
580- @misc{owl2025,
581- title = {OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation},
582- author = {{CAMEL-AI.org}},
583- howpublished = {\url{https://github.com/camel-ai/owl}},
584- note = {Accessed: 2025-03-07},
585- year = {2025}
613+ @misc{hu2025owl,
614+ title={OWL: Optimized Workforce Learning for General Multi-Agent Assistance in Real-World Task Automation},
615+ author={Mengkang Hu and Yuhang Zhou and Wendong Fan and Yuzhou Nie and Bowei Xia and Tao Sun and Ziyu Ye and Zhaoxuan Jin and Yingru Li and Qiguang Chen and Zeyu Zhang and Yifeng Wang and Qianshuo Ye and Bernard Ghanem and Ping Luo and Guohao Li},
616+ year={2025},
617+ eprint={2505.23885},
618+ archivePrefix={arXiv},
619+ primaryClass={cs.AI},
620+ url={https://arxiv.org/abs/2505.23885},
586621}
587622```
588623
@@ -611,7 +646,7 @@ OWLのGAIAベンチマークスコア58.18を再現するには:
611646
612647さらなる議論に参加してください!
613648<!--  -->
614- ![ ] ( ./assets/community .jpeg )
649+ ![ ] ( ./assets/community_code .jpeg )
615650
616651# ❓ FAQ
617652
@@ -627,6 +662,16 @@ A: OWLはPython 3.10、3.11、および3.12をサポートしています。
627662
628663A: 参加方法の詳細については、[ 貢献] ( #-貢献 ) セクションを参照してください。コードの改善からドキュメントの更新まで、あらゆる種類の貢献を歓迎します。
629664
665+ ## 実験の質問
666+
667+ ** Q: どのCAMELバージョンを使用してロールプレイングの結果を複製すべきですか?**
668+
669+ A: gaia69ブランチで修正されたCAMELバージョン(owl/camel)を提供しています。実験にはこのCAMELバージョンを使用してください。
670+
671+ ** Q: なぜ実験結果が報告された数値よりも低いのですか?**
672+
673+ A: GAIAベンチマークは現実世界でLLMエージェントを評価するため、大きなランダム性が導入されます。ユーザーのフィードバックに基づくと、複製において最も一般的な問題の一つは、例えば、ネットワークの理由で特定のウェブページでエージェントがブロックされることです。これらのエラーを迅速にフィルタリングするためのキーワードマッチングスクリプトを[ こちら] ( https://github.com/camel-ai/owl/blob/gaia58.18/owl/filter_failed_cases.py ) にアップロードしました。現実的なオープンワールド環境でLLMエージェントを評価する際の詳細については、この[ 技術報告書] ( https://hypnotic-mind-6bd.notion.site/OWL-Optimized-Workforce-Learning-for-General-Multi-Agent-Assistance-in-Real-World-Task-Automation-1d4004aeb21380158749c7f84b20643f?pvs=74 ) も確認できます。
674+
630675# 📚 CAMEL依存関係の探索
631676
632677OWLは[ CAMEL] ( https://github.com/camel-ai/camel ) フレームワークの上に構築されています。以下は、CAMELのソースコードを探索し、OWLとの連携方法を理解する方法です:
0 commit comments