,

ローカルAI、実は不便?

新しいモバイルノートPC選びについて、引き続きGeminiに意見を求めることが多くなっています。先日の「ThinkPad X13 Gen 6・WWANの重さを考える」あたりでは、アイデアのスタートは自分で思いついたモノですが、内容を整理していくときには、Geminiに質問して、返ってくる内容を見ながら組み立てています。例えば、Geminiが製品重量についてあまりにもいい加減な答えばかり返してくるので、元資料を調べ直して、ソースによって記載される重量が異なっていることに気が付いた…なんてことがありました。

基本的には「自然につながる文章をつないでいくだけ」という仕組み上、基本的にチャットAIはこちらの投げかけに沿った回答を返してくるので、アタマの整理には実に有用です。しかし、信頼できるレベルの元データが見つからないと「口から出任せ」でテキトーな嘘をつくことも結構ある…という「ハルシネーション(Hallucination; 幻覚)」は、現状の大きな問題点だと思います。

こちらが既に十分理解している内容でもない限り、出てくる回答の信憑性については、まずは疑ってかかるくらいの姿勢が必要そうです。もっとも、ものすごい速度で進歩を続けている世界なので、その先入観自体も疑いながら進まなくてはなりませんね。ちなみに、GeminiのWebインターフェースには、Geminiが生成した回答に対してWebで再検索を行い「ファクトチェック」をする機能も付いています。当面は、これを活用しながらの方が安全です。


最近、おカネをいただく仕事の関係では、Geminiと同じくGoogleが提供している、NotebookLMというWebサービスを試用しているところです。Geminiが既に学習している知識やWeb上にある情報を使って、チャット形式で質問に答えてくれるのに対して、NotebookLMはユーザーが持っている文書や音声などのデータ、Webページなどを与えることでそれを知識として整理し、Gemini同様のインターフェースで活用できるようになります。

今年に入ってから、インタビューや講演会、意見交換会等の内容を資料にまとめる仕事が多かったのですが、録音データをNotebookLMに放り込むだけで、内容を解析し、要約を文書にとりまとめてもらったり、内容についてチャットで質問すると回答をもらえたり…ということができるようになります。固有名詞などはどうしても間違えることがありますが、内容の本質については正しく捉えられているように見えます。AIがここまでできるのなら、もはや録音の文字起こしは人間がやる仕事ではないと感じます。

さらには、NotebookLMには「音声概要」という機能があります。これは、放り込んだデータを元にして、男女2人組がポッドキャスト風にカジュアルに会話している音声を5分くらいの長さで作ります。「レッツノート以外の何か・2023 (1)」以降の一連のPC選びに悩む記事をソースにして、ちょっと作らせてみました。

Choosing the Next Mobile PC: A Comprehensive Quest

TOPSを「とっぷす」と読んだり「てぃーおーぴーえす」と読んだりする揺れは気になったものの、合成音声とは思えない自然な声で、会話が展開されました。私の偏った視点の記事をベースにした会話なので、内容的にはツッコミどころ満載なのですが、私の翻弄されまくったこの2年間の流れは捉えられています。最後では、「この(業界の変化の)速さの中で、常に最新スペックを追い続けるべきなのか、それとも、多少トレンドに乗り遅れても、今確実に自分の役に立つ信頼できる道具を選ぶべきなのか」なんて問題提起までされてしまいました。まったく、ごもっともでございます(汗)。


Geminiにも、NotebookLMにも、Chrome等のWebブラウザーからアクセスするWebインターフェースの他に、スマートフォン用のアプリがあります。Pixel 8にも両方のアプリをインストールしてありますが、同じGoogle アカウントでログインすれば、どちらにも同じやりとりが保存されていて、シームレスに作業の続きができるようになっています。

これは、当然ながらこれらがクラウドサービスであり、Googleがサーバー上に情報を保存しているからこそ実現できることです。一方で、これまでクラウドが担当するのが当たり前だったAIの処理を、クライアント(端末)側で行わせてしまおう…というのが、昨今の「ローカルAI」という動き。AI PCも、Copilot+ PCも、ローカルAIの実現に必要なハードウェアを普及させるためのキャンペーン戦略ということになります。

ローカルAIにすることで、反応の早さ、セキュリティリスクの低減などのメリットはあるわけですが、私がひとつ気になっているのが、情報が基本的に個々の端末の中で閉じてしまうこと。少なくとも、現在GeminiやNotebookLMでしているような、端末間でシームレスに処理をつなぐ使い方はできなくなって、おそらく不便になりますが、それ以前に問題になりそうな点がもうひとつあります。

私の場合、日常的に使っている情報端末は個人持ちのレッツノート・CF-SV8とスマートフォン・Pixel 8、そして職場から支給されているFMVということになりますが、仕事用端末はともかく、個人用の2台に関しては「いつか見たアレ」がどちらを使って見ていたものなのか?なんて覚えていられません。それができるなら、そもそもRecallなんて機能は要らないわけで…。

せっかくのRecall機能も、「どのデバイスで見たモノだったかな?」というところは自分で思い出さなくてはならない…というのが、ちょっともどかしいことになりそうです。もっとも、実質的に2台だけなのだから、PCで見つからなければスマホで見たんだろうなぁ…ということになり、あきらめて次の手がかりを探しに行けるとは思うんですけどね。

さすがにRecallのスクリーンショット履歴を全てアップロードして記録するのは無理だと思いますが、インデックスだけでもクラウドで集約できるオプションがあれば、ずいぶん利便性が上がる気がします。Recall機能そのものもオプトインで使わせているのだから、そこのリスクはユーザーに管理を任せても良いのかもしれません。「毒を食らわば皿まで」感もありますが…。


AIとは違いますが、同様にセキュリティやプライバシーの観点からクラウドでの共有を廃止してデバイス単位にデータを固定してしまったことで、取り扱いに不便さが出ているサービスを知っています。Google マップの「タイムライン」は、位置情報の履歴を保存しておき、過去に自分の行った場所を振り返ることができる、旅行好きの私には結構嬉しい機能です。

しかし、昨年からクラウドでのリアルタイム同期は廃止されてしまい、画面の広いPC用のブラウザーからは見られなくなってしまいました。位置情報の履歴はスマートフォン上に保存され、アプリ上からの記録・閲覧は引き続きできるようになっているのですが、やっぱり画面が小さいのがツラいですね。非常に不便を感じています。

タイムラインデータのサーバーへのバックアップ自体は可能にしているのですから、こちらもユーザーに選択を委ねてもらえるとウレシイのですが…。とはいえ、複数の選択肢を設けること自体が面倒になる…というのもわかりますし、こうなってしまったのも仕方ないのかも知れません。



コメント

“ローカルAI、実は不便?” への1件のコメント

  1. webmasterのアバター
    webmaster

    「音声解説」へのリンクも追加しました。お暇でしたら、ちょっと聴いてみてください。

コメントを残す

アーカイブ

2025年7月
 123456
78910111213
14151617181920
21222324252627
28293031  

タグクラウド

Amazon Android BESS Bluetooth CF-B5 CF-R2 CF-RZ4 CF-SV8 DIY iPhone LTE Nintendo Switch NuAns NEO Reloaded SNS SSD USB PD USB Type-C Webサイト Webブラウザー Windows 10 Windows XP カメラ カーナビ クルマ ショップ ステップワゴンスパーダ スマートフォン バージョンアップ ブログ マラソン レッツノート ログハウス ワイヤレスWAN 中日ドラゴンズ 伊豆 倉庫 健康 写真 合唱 塗装 家族 携帯電話 旅行 日本プロ野球 映画 暮らし 東京 槇原敬之 浜松 無線LAN 自作PC 芝生 薪ストーブ 記念日 野球 音楽 食べる