my notebook

OpenAI API で GPT-4o-mini に英作文の添削をしてもらう
Thursday, October 31, 2024

以前に大学受験の学生に英作文の添削を頼まれてつくったものです。普通に ChatGPT でもできると思いますが、毎回添削対象英作文以外のプロンプトは固定なので、APIでつくりました。単に間違いを修正するだけでなく、修正個所について箇条書きで説明してもらうようにプロンプトで指示を出しています。

今なら GPTs を使うとよいのかもしれません。

API の場合、月額課金ではなく使用量に応じた課金なので、処理量が少なかったり実験レベルのアイデアの検証には API 課金の方が良い。

なお、ここではシンプルにエンドポイントのURLに所定形式のJSONを投げて回答をもらう方式で実装していきます。実装言語は Kotlin です。

以前のエントリーでカタログスペックテキストから日本語LLM ELYZA を使って情報を抜き出すことを試しました。これを GPT-4oで試してみます。今回は Python ではなく Kotlin スクリプトを使い、直接 OpenAI API にアクセスします。

Open AI API の Chat Completions API の使い方はこちらをご覧ください。

https://platform.openai.com/docs/guides/text-generation/chat-completions-api

もし GPT-4o が十分に性能が高ければカタログスペックテキスト校正の支援ができるのではないか？と期待したり。

GPT-4o ( gpt-4o-2024-05-13 ) が出たので、兼好法師に質問するときにこのモデルを使ってみた。基本的には、前回のエントリー(LangChain RetrievalQA を使って兼好法師に質問するその２) と同じ。ただし、実際にやってみると以前のコードのままでは肝心の Q&A する部分が作動しなかったので、その部分は調整しました。

今回は、前回の Embeddings の計算を OpenAIのそれではなく、Multilingual-E5-base に代えて RetrievalQA してみます。なお、RetrievalQA の処理自体は引き続き OpenAI の LLM を使用します。

対象とするコンテンツ（現代語訳徒然草 (吉田兼好著・吾妻利秋訳) ）の準備やコードは（Embeddings 計算を除いて）前回を踏襲します。

» Read More

LangChain RetrievalQA を使って兼好法師に質問する
Saturday, April 13, 2024

現代語訳徒然草 (吉田兼好著・吾妻利秋訳)と LangChainをつかって吉田兼好に人生の悩みを質問してみる。

現代語訳徒然草をデータとして RetrievalQA を使うことで、最終的に次のような質問から回答を得ることができました。

(質問) その道のプロとしてふさわしい立ち振舞について教えてください。
- (回答) 「一言芳談」や「和漢朗詠集」など、尊敬すべき先人の言葉や作品を読み、感動することは大切です。しかし、それを自慢したり、栄光を自分のものにしようとするのは愚かです。また、自分の間違いを素直に認め、改善することも大切です。謙虚さと誠実さを持って、道を極めることがプロとしてふさわしい立ち振舞いだと思います。
(質問) 専門家が陥りがちな間違いや見苦しい行為にはどんなことがありますか？
- (回答) 「偉い」と思い込み、自分の知識や専門分野について自慢することや、それを知らない人に対して上から目線で語ること。また、自分の専門ではない分野に対しても詳しそうに振る舞うことや、知らないことを偉そうに語ることがあります。このような行為は、専門家としての信用を損ない、見苦しい行為となります。

・・・なかなか興味深い。

» Read More

日本語 LLM ELYZA 追伸
Wednesday, November 8, 2023

torch_dtype=torch.float16 指定を外すとどうなるか試しました。

» Read More

日本語 LLM ELYZA で JSON を返すサーバをつくる
Tuesday, November 7, 2023

そこそこに速いシリコンマックで ELYZA-japanese-Llama-2-7b-fast-instruct を使ってクライアントからテキストを投げると JSON文字列を返すサーバをつくります。

Large Language Model をローカルで動かす時代が到来するらしい。

Reddit には LocalLLaMA というサブレディットがあり、かなり盛り上がっている。そこではシリコンマックを使っているひとが結構いる。 Meta の商用利用も可能な Llama 2 がオープンソースで提供された結果、その派生プロジェクトがいろいろ存在している。そのなかには、低スペックのシリコンマックでも LLM を実行できるものがある。 Pytorch もMetal 対応していて、おそらくは、Pytorch 依存の LLM モデルについては、Linux + CUDA と同じ手順で動かせるのではないかと思う。

Pytorch を使う方法を手元の M1 Macbook Air 8GB で試したが残念ながら作動しなかった。たぶんメモリが足りないのだと思う。十分メモリがあれば動くのではないかと思うが定かではない。

それでも Llama.cppと軽量化されたモデルを使うことで M1 Macbook Air 8GB でも作動させることができた。

このエントリーでは、Linux + CUDA で、 Llama 2 をベースに商用利用可能な日本語LLM ELYZA を試します。

» Read More