AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2501.04519 どんなもの rStar-Mathは、大規模言語モデル(LLM)からの蒸留なしに、小さな言語モデル(SLM)がOpenAI o1と同等以上の数学的推論能力を持つ …
Fact-aware Sentence Split and Rephrase with Permutation Invariant Training (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2001.11383 どんなもの 複雑な文を意味を保ったまま複数の簡単な文に分割・言い換える Sentence Split and Rephrase タスクのための新しいフレームワ …
Leave No Context Behind: Efficient Infinite Context Transformers with Infini-attention (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2404.07143 どんなもの Transformerベースの大規模言語モデル(LLMs)を、bounded memoryとcomputationで無限長の入力にスケールするため …
Only-IF :Revealing the Decisive Effect of instruction diversity on Generalization (AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2410.04717 どんなもの 大規模言語モデル(LLM)の指示遵守能力を向上させるためのデータセット構築戦略に関する研究。特に、instruction diversity(指示 …
Steering Knowledge Selection Behaviours in LLMs via SAE-Based Representation Engineering (AI論文要約)
Mechanistic Unlearning: Robust Knowledge Unlearning and Editing via Mechanistic Localization(AI論文要約)
AIを使った論文要約です。簡単なサーベイ用で詳細は論文を参照してください。 https://arxiv.org/abs/2410.12949 どんなもの 本論文は、大規模言語モデル(LLM)から望ましくない知識を削除または修正する「知識のアンラーニングと編集」手法に関する研究です。特に、モデルの特定 …
Mixture of expertsのサンプル実装
huggingfaceのgenerationの関数をtorch modelから使えるようにしたい
llama2のアーキテクチャを変更してpre trainingしてみる
複数ファイルに分割されたデータセットをHuggingface Hubにアップロードするメモ
HuggingfaceのDataLoaderとDatacollatorのソースコードを眺める
xgenでJGLUEを試す
OpenCALM-7Bをloraで学習して、quantizeするまで
loraで学習する場合のpromptって何でも良いんだっけ?rinna instruction 3Bで試す
rinna 3Bをcppで動かす
VicunaでReActっぽいことを試してみる
Rust TokenizerをC++から呼び出す
BloomをLoRaで日本語finetuning
LlamaIndex(GPTIndex)を触る
code blockにrefarenceをつける
Hugoでコードブロックを使うときは、GitHubからの引用し、その下に参照元のURLを貼り付けることが多い。 コードブロックの下にそのままURLが表示されるの若干見づらかったので、コードブロックとセットでいい感じに表示したい。 HugoにMarkdown Render Hooksに …