オフラインで、無料で、AIとつながり続ける: Llamafiles の魔法

-

| Read in English

オンラインとは一線を画す、革新的なオフラインAIツール「llamafiles」について調べてみた。 オープンソースの愛好家たちによって開発されたこのツールは、アクセス可能なオープンソースのAI技術への動きを示している。

少し技術的な投稿になる。読者の大半はビジネス関連の仕事をしていると思うので、技術的にどのように機能するかについては深く掘り下げないが、私が役立つと感じたもの、そしてAIの利用方法に関して今後起こりうる未来のひとつだと思うものを紹介したい。

ChatGPTだけではない

これを読んでいる皆さんの大半は、OpenAIのChatGPTをご存じで、また、使ったことがあるだろう。ChatGPTは私たちにAIの話題を切り開く素晴らしい仕事をしたが、ChatGPTだけが "AI "ベースのチャットツールではないことをご存知だろうか?例えばGoogle's Bardや、 Microsoft's CopilotClaude by Anthropic等、他にも代替えツールがある。

上記のAIツールには共通点がある。それらはオンラインであり、インターネットを通してアクセスする必要がある、ということだ。

ChatGPTのような要約や文章作成に役立つAIツールは、インターネットに接続していなくても使えることをご存知だろうか?

さて、私は サイモン ウィルソンのブログという記事を読んでみた。サイモンはPythonコミュニティの活動的なメンバーで、Python Software Foundation (PSF).の理事も務めている。彼はAI技術、特にオープンソース化された様々なモデルについて積極的に実験しており、また私たちがAIを使いやすくするためのツールも開発している。

すべてを支配する1つのllamafile

特に、彼が2023年11月に書いたこの記事を紹介したい。この投稿では、llamafileと呼ばれるものを紹介している。

では、llamafileの何がそんなにすごいのか?llamafileは、オフラインで使用できる大規模言語モデル (LLM) を単一のファイルで配布し、何もインストールすることなく同じファイルを使って様々なプラットフォームで動作させることを可能にする。

llamafileは、あなたのコンピュータ上でAIプログラムを実行するための、オールインワンの大きなパッケージのようなものだ。そこにはあなたの必要なものがすべて入っている。 AIの "頭脳"(私たちはモデルウェイトと呼んでいる)、LLM、そしてその使い方の説明書だ。さらにそれには、ウェブブラウザーから直接AIと対話できるミニウェブサイトも含まれている。使用されているLLMは、MistralのようなオープンソースのLLMだ。

コンピュータを使ったことがある人なら、このようなことがいかに難しいか理解できるだろう。一つは、LLMをたった一つのファイルで配布すること自体が一つの大きな偉業であり、それをWindows、Mac、Linuxといった複数の異なるプラットフォームで、事前にソフトウェアをインストールすることなく実行可能にすることは、ただただ驚くべきことなのだ。

llamafileを使う

Huggingfaceからllamafileをこちらからダウンロードしてみよう。(注意: 容量は約4.3GB).

ダウンロードしたら、ターミナルを開いて実行ファイルにし、以下のように実行してほしい。

iqbal [~/llama]$ ./llava-v1.5-7b-q4.llamafile 

私はUbuntu Linux上でこれを実行しているが、Windowsを使っている場合は、この記事が役に立つかもしれない。

実行したら、ブラウザからhttp://127.0.0.1:8080/にアクセスすれば、このように表示される:

Llamafile Startup Screen

サイモンのブログ記事にアクセスして、日本語で要約してくれるように頼み、テストしてみた。結果はこの通りだった:

Llamafile Output Sample

かなり素晴らしい。かなり印象的だ。2021年末に購入したGPUなしのDell X13 9310ラップトップでは、上にあるように1秒間に7.73トークンを生成した。この数字は、どれだけ「速く」答えを生成できるかを示している。メモリとCPUが大きいほど、この数値は高くなる。

また、写真をアップロードして要約を要求してみた。日本語で質問したにも関わらず、要約を英語で返してくれた。写真の要約は正しい。

Llamafile Blue Sky Sample

まとめ

ChatGPTやCopilotのようなオンライン・ツールを使わずに、あなたのコンピューターでLLMを実行する例を紹介した。もしあなたがエンジニアで、ソフトウェアを扱う仕事をしているのであれば、これを機能させるために多くの人が費やした素晴らしい労力に感謝することだろう。

しかし、それ以外の人々にとってはどうなのだろうか。私はこの投稿を、あなたのコンピューターでLLMを動作させるためにさまざまなパーツがどのように連動しているのか、という細かい技術的な説明として書いたつもりはない。

しかし、LLM(そしてそのコースではAIも)のパワーをオープンな方法で、興味のある人なら誰でもアクセスできるようにするために、イノベーションのスピードと、どれだけ多くの取り組みが行われているかを印象づけることができたと思う。つまり、LLMの民主化だ。

このような動きから、少なくとも下記の2つは来年か再来年のうちに実現すると思う。

コスト削減

  1. オープンソース LLMs: オープンソースLLMの進歩や発展により、ChatGPTで使用されているGPT-4のような、独自のLLMに代わるものが出てきた。

  2. 競争の激化 オープンソース LLM の出現により、健全な競争が導入される。よりアクセスしやすい代替手段が利用可能になるにつれて、独自の LLM プロバイダーは価格戦略を調整する必要があるかも知れない。

大手プロバイダーからの分離

  1. 独占の破壊 独自の LLM により、一部の企業がAIの分野を独占できるようになった。オープンソースの代替案は、アクセス可能な代替案を提供することで、この独占を打破する。オープンソースLLMの知名度が高まるにつれて、データアクセスや価格設定の制御などの独占的な慣行が精査される可能性がある。

  2. ビジネスモデルは進化する 企業はLLMライセンスの販売から、オープンソースモデルを中心とした付加価値サービスの提供へとシフトするかもしれない。カスタマイズ、サポート、統合が重要となる。収益化戦略は、直接ライセンスからサブスクリプションベースのサービスやコンサルティングに移行する可能性がある。

  3. 戦略的提携 AIプラットフォーム企業はオープンソースコミュニティと協業する可能性がある。それにより、独自のコンポーネントとオープンソースのコンポーネントを組み合わせたハイブリッドモデルが登場するかも知れない。戦略的パートナーシップはイノベーションを強化し、市場のニーズに対応することが可能となる。

Kafkai(カフカイ) は llamafile を使用していないが、短い記事を要約したり、特に飛行機内などインターネットに接続されていない時に、作業の一部を書き直す等のタスクには使っている。少なくとも、この種の技術革新と改善こそが、AI業界での仕事を楽しく興味深いものにしているのだ。

kafkai logo