Windowsユーザー待望のChatGPTアプリが登場
OpenAI, Inc.は11月15日、Windows向けのChatGPTアプリをリリースした。
これまで、Mac版はあったのだが、Windows版はなかったため、Windowsユーザはブラウザ版を使うしかなかった。
これにより、Windows専用のChatGPTアプリをパソコンで利用することができ、電子メールやスクリーンショット、ファイルなど、画面上のあらゆるものについてチャットすることができる。
とはいえ、特別何か新しいことができると言うわけではないので、使い勝手が良くなったくらい、と捉えると良いだろう。
例えばスクリーンショットの画像であれば、これまでのブラウザ版のChatGPTでは、一度スクリーンショットで撮った画像を添付する必要があった。
今回発表された専用のChatGPTアプリには、スクリーンショットを撮るボタンがUIに配置されており、このボタンを押してからスクリーンショットを撮ることで、すぐに画像がChatGPTに貼られる仕様だ。
ChatGPTへアクセスしたい場合は、キーボードのショートカットAlt + Spaceを使用して、デスクトップの任意の画面から ChatGPT開くことができる。
これにより、ファイルのアップロードについても、ショートカットキーでChatGPTを呼び出し、デスクトップ上のChatGPTアプリのファイルボタンから、3クリック程でアップロードすることが可能だ。
ブラウザ版では、ウェブブラウザを開き、ChatGPTへアクセスしてから画像やファイルのアップロードを行うという手順を踏んでいたが、今回のChatGPTアプリによりスムーズな利用が可能となるため、利用頻度が高くなりそうだ。
また、Mac版のChatGPTアプリでは、「Work with Apps」というアプリと連携できる機能も追加されている。
Windows版においても、今後の機能追加やアップデートに注目したい。
Perplexityにショッピング機能を追加
Perplexity AI, Inc.は11月18日、同社が展開するAIチャットボット型の検索エンジンであるPerplexityにおいて、AIを活用したショッピングアシスタントを発表した。
Perplexityといえば、AI検索エンジンということで、Googleを超えるのではないか?と評判だった。GoogleもGeminiを発表しているが、今回のような機能はまだない。
米国のPerplexity Proユーザは、あらかじめ配送情報と請求情報を保存しておくことで、Perplexityから商品を注文することができるようになった。
また、Perplexityで写真から商品を見つけることができる検索ツール「Snap to Shop」も発表された。
これは、手持ちの商品の写真をPerplexityにアップロードすることで、写真と関連する商品が表示されるというものだ。
そして、関連商品の詳細や販売サイトのURLなどを得ることができる。
こちらは、既存のGoolge画像検索(Googleレンズ)でも似たようなことができるので、それでも良いのではないか?と感じる人もいるかもしれないが、AI検索でデファクトスタンダードになろうとしているPerplexityにとってみれば、必須の機能とも言えるだろう。
また、Perplexityに商品に関する質問の回答も得ることができるとのことだ。
商品を単に見つけるだけでなく、見つけたら次はその商品を深掘りしてスペックや懸念点の解消などをしたいところなので、商品に関する質問を受け付けてくれるのはありがたい。
そもそも、LLMでは店員と会話をしているかの如く、商品購買ができなければいけないということもあるので、例えば、この例であればダイソンの扇風機が動いているところが見られるとか、部屋に置いたらどのくらいのサイズかがわかるとか、そういった扇風機に関して知りたいことをもっと深掘りできれば、手放せない便利さとなるだろう。
なお、「Snap to Shop」は、Shopifyを含むプラットフォーム統合によって強化されており、米国に販売および出荷するShopifyを活用したビジネス全体の製品に関する関連情報にアクセスするのだという。
この機能を使えるようになれば、商品名がわからないときにも検索して商品に辿り着くことができる。
小売事業者も、画像をメインとしたSNSなどを活用し、新たな販売戦略を打つことができそうだ。
まずは米国でリリースするとのことだが、今後日本でも展開されることに期待したい。
Googleの「Gemini Advanced」にメモリー機能を搭載
Google LLCは、11月19日、同社が提供する最新のAIモデル「Gemini Advanced」に、興味や好みを記憶させることができる機能を追加した。
この機能では、興味やフォーマット、日付、重要な情報、スタイル、パフォーマンス、トーンを「Gemini Advanced」が記憶するとしている。
例えば、肩書きやベジタリアンであること、メールの件名オプションの指定を行い、「メールを書いて」と指示すると、この記憶した内容を加味した文章を書いてくれているというものだ。
自分の属性をAIが覚えておいてくれていれば、お店選びを頼むときも、メールを代わりに書いてもらうときも、飛行機を抑えてもらうときも、自分好みのやり取りをしてくれそうな未来が見える。
単純な受け応えはそれなりにできるようになってきた生成AI、今回は設定が必要ということだが、これを会話の中で理解してくれるようになってくれば、もっとさりげないコミュニケーションがとれるAIエージェントになりそうだ。
なお、共有した情報は、表示、編集、削除が可能で、いつ使用されたかを確認することもできる。
ChatGPTにおいても、こうした記憶機能は以前から搭載されているが、Geminiの回答精度や使い勝手が良いと感じているユーザからすると、重宝する機能だろう。
Microsoft 365 Copilotを活用したエージェントによりリアルタイム通訳などが可能に
Microsoft Corporationは11月19日、同社が開催したイベント「Microsoft Ignite 2024」にて、Microsoft 365 Copilotを活用した新しいエージェントを発表した。
Microsoft 365 Copilotは、WordやExcel、PowerPoinといったMicrosoft 365のアプリと連携して、ユーザの作業を効率化する生成AIサービスだ。
今回新たに、コラボレーションやドキュメント管理等を行うためのソフトウェア製品「SharePoint」に導入され、「SharePoint」内のエージェントに質問などをすることができるようになった。
ユーザは「SharePoint」のデータに基づき、サイトからリアルタイムの情報と洞察を取得することができる。
また、Teamsにおいても、Microsoft 365 Copilotを活用した新たなエージェントが発表された。
一つ目はファシリテーターエージェントで、Teamsでの会議中にファシリテーターがリアルタイムでメモを取り、全員が共同執筆や共同作業を行うことができるようになった。
なお、メモには、AIによって生成されたものか、ユーザがコンテンツを編集したものかの属性も表示されるとのことだ。
二つ目は、Teamsの会議中にリアルタイムで音声通訳を行う通訳エージェントだ。
これにより、Teamsの会議において、各ユーザが選択した言語で話したり聞いたりできるようになる。
現在選択できる言語は、中国語(北京語)、英語、フランス語、ドイツ語、イタリア語、日本語、韓国語、ポルトガル語(ブラジル)、スペイン語の9つだ。
三つ目は、Teamsのタスクと計画をまとめて管理するPlannerアプリ内において、目標を入力することで計画を自動的に作成したり、事前設定されたテンプレートを使用したりすることができるプロジェクトマネージャーエージェントだ。
ユーザがPlanneアプリで計画を作成すると、エージェントが「タスクの割り当て」「進捗状況の追跡」「リマインダーと通知」「ステータスレポート」など、プロジェクト全体を監督する。
タスクが完了すると、エージェントがそれらを「完了」列に移動する。
ユーザは、エージェントが完了したタスクとコンテンツの出力を確認し、必要であればコンテンツの編集が可能だ。
また、ユーザはコメントを介してフィードバックを追加できる。例えば、コンテンツを要約したり、表形式にしたり、物語形式で書き直したりするようにエージェントに依頼することができる。
これらにより、ユーザはTeamsを活用するだけで、会議の議事録から通訳、プロジェクト管理までエージェントがサポートしてくれるということだ。
ここまでくると、文字通り「エージェント」の役割を担ってくれていると感じる。
筆者はまだこれらのエージェント機能を活用していないが、ある程度の精度を保ってくれるのであれば、「オンライン会議は基本Teams」という習慣ができそうだ。
GPT-4oをアップデートしライティングとファイル処理能力が向上
OpenAIは11月20日、テキスト・音声・画像・ビデオといった様々な形式のデータを入出力するフラグシップモデル「GPT-4o」をアップデートしたと発表した。
最新のモデル名は「GPT-4o-2024-11-20」で、ライティング能力とファイルの処理能力を向上させたのだという。
5月に発表された「GPT-4o」は、話者をカメラで映しながら会話することで、話者の洋服を褒めてくれるといったマルチモーダルな特徴にフォーカスされていたと感じるが、今回、ライティングとファイル処理という根本的な部分がアップデートされた形だ。
具体的には、創造的な文章能力がレベルアップし、より自然でカスタマイズされた文章となり、関連性と読みやすさが向上した。
また、アップロードされたファイルに対するより深い洞察と応答を提供するとのことだ。
なお、「GPT-4o」は、LLMのベンチマークプラットフォームにおいて、Googleが提供する生成AIモデルGeminiに1位の座を奪われていたが、今回のアップデートで首位を奪還した。