ぱたへね

はてなダイアリーはrustの色分けができないのでこっちに来た

LLM本番システム構築ノウハウ

LLM本番システム構築ノウハウを読みました。 ざっと全体を読むだけでも結構苦労しました。難易度高いですがLLMで何かシステムを作る人にはお勧めです。

book.impress.co.jp

この本の特徴としてはLLMの話をするときに言語学を絡めて説明しているところです。2章がまさに言語学の説明ですし、最後の12章や付録でも言語学について説明があります。正直良く分からないのでさらっと読みましたが、そこを抜いてもLLMに関する技術の説明は詳しく説明されてました。

2章のLLMの仕組みについては別の本でも学習できると思う。知っていれば飛ばせるし、知らない人には駆け足過ぎると思いました。

3章、4章でLLMを使ったシステムを作るための構成要素を具体的なライブラリを挙げて説明してあるところから本番で、LLaMAの紹介から業界標準の評価指標やベンチマークの説明があります。独自のベンチマークを作るためにHugging FaceのEvaluateライブラリが紹介されています。この辺が全然知らなかったので機会があれば使ってみたいです。

5章で学習について説明があったあと、6章でLLMを使ったサービスの作り方が出てきます。学習したモデルをデプロイするための簡単なコードと何をやっているかの説明があります。特に監視系の話は、他のLLMの本では読んだことがなかったので、これも役に立ちそうです。

7章のプロンプトエンジニアリングは、オライリーのLLMのプロンプトエンジニアリングの方が分かりやすいと思った。

www.oreilly.co.jp

9章のLLaMAの実装では、モデルの学習環境構築から量子化、QLoRA等をLLMを動かす環境を作ります。実装と言いつつも、実際には大半がライブラリ呼び出しですが何か動かしてみるのは良いと思います。

10章、11章ではRAGを導入しVS CodeのLLMを使った機能拡張の実装、ラズパイへのデプロイをやります。どっちもやってみましたレベルですが、LLMの本でここまでやっているのは珍しいです。本にも実用的では無いと書いてあり、ここで興味持ったら個別のトピックを自分で調べれば良いでしょう。

最後は法律の問題など、実社会との接点についていろいろと懸念点が挙げられています。マルチモーダルに関しては紹介程度でした。これは残念です。

全体的に翻訳の質も高く、いろいろLLM以外の所での翻訳が大変な気がしますが、最後まで読みやすい日本語でした。LLMに関わる人なら一回さっと目を通して、その後もう一度細かく読むような形が良いと思います。