Создание универсального парсера документации 1С для извлечения синтаксиса и создания контекстных файлов для языковых моделей (LLM).
- Модульная структура - каждый компонент выполняет свою задачу
- Обработка потоков - поддержка больших файлов
- Множественные форматы - JSON, TXT, Markdown
- Поисковый индекс - быстрый поиск по ключевым словам
- Python 3.8+ - основной язык
- BeautifulSoup4 - парсинг HTML
- lxml - быстрый XML/HTML парсер
- zipfile - работа с архивами
- Полная обработка: Все файлы документации (по умолчанию)
- Поддержка больших архивов: до 50MB+
- Оптимизированный поиск: индексация ключевых слов
- Ограниченная обработка: Доступна при указании параметра
max_files
- Content: Краткое описание для быстрого понимания
- Metadata: Структурированные данные для программного доступа
- Специализированные поля: syntax_variants, parameters_by_variant, collection_elements
- Информация об использовании: methods, availability, version
- Основной файл: ~25000 HTML файлов (полная документация)
- Файл оглавления: 51065 HTML файлов
- Общий размер: 70MB+ данных
- Объекты: 24,048 (из полной документации)
- Методы: 105 (из полной документации)
- Функции: 117 (из полной документации)
- Операторы: 22 (из полной документации)
- Свойства: 49 (из полной документации)
- Всего элементов: 24,341
- JSON файлы: 3+ структурированных данных
- Текстовые файлы: 2+ для LLM
- Поисковые индексы: 2+ для быстрого поиска
- Оптимизированная версия: 1,240 элементов (5.2MB)
- Убрать ограничение в 500 файлов
- Добавить оптимизированную версию
- Улучшить структуру данных (content/metadata)
- Добавить веб-интерфейс
- Поддержка других версий 1С
- Автоматическое обновление документации
- Интеграция с популярными LLM
- API для внешних систем
- Машинное обучение для улучшения парсинга
- Поддержка других языков программирования
- Облачная версия
- Мобильное приложение
- Отчеты об ошибках
- Предложения новых функций
- Улучшение документации
- Код-ревью
- GitHub Issues
- Документация
- Примеры использования
- FAQ
MIT License - свободное использование для любых целей.
- Команде 1С за документацию
- Сообществу разработчиков 1С
- Проекту BeautifulSoup
- Всем участникам проекта