Skip to content

国会議事録コーパスのフォーマッティング #114

@hkiyomaru

Description

@hkiyomaru

Overview

国会議事録コーパスのフォーマッティングを行う

Details

国会議事録コーパスのフォーマッティングを行う:

  • speechID が同じ一連の発話を1文書とする
  • \r\n\n に置換
  • 発話間は \n\n でつなぐ

Resources

  • 計算機
    • クラスタ: sakura
    • ノード種別: cpu
    • ノード台数: 1
  • コード
  • 評価データ:
    • N/A
  • 出力データ:
    • 保存先: sakura:/data/experiments/114_kokkai_giji/outputs
  • W&B ログ:
    • N/A
  • 開始日: 2025-01-27
  • 終了予定日: YYYY-MM-DD

Metadata

Metadata

Assignees

No one assigned

    Labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions