EVALUATING THE DIVERSITY AND QUALITY OF LLM GENERATED CONTENT

AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2504.12522 AIが作る文章やプログラムの「質」と「種類の豊富さ(多様性)」をどう評価するかの研究です。この論文では、ただ多様なだけでなく「使える(質の高い)」アウトプット …

データセット評価指標

以下では LLM 学習用データセットの多様性(あるいは「同質性」を避けられているか)を測る代表的な指標を、定義 → 計算方法 → 読み取り方 → 長所/限界 の順で簡潔に整理します。 distinct-N paper code 定義 生成コーパス(または学習データ)の中で 重複を除いた n-gram …