← ニュースAll
読み書きAIの今
要約
山田祥平氏がGoogleのGemini最新版を試し、3つのモード(高速・思考・Pro)の違いや利用感を述べています。長時間音声の認識やファイル結合の課題、生成の回数制限などの現状と、クラウド処理では端末性能差が小さい点を指摘しています。
本文
記事は、Googleの生成AI「Gemini」を中心に、最新バージョンの使い勝手と限界を論じています。Geminiには高速・思考・Proの3モードがあり、用途に応じて使い分けられる点が紹介されています。筆者はかつてのパソコン通信の経験を引き合いに、AIとの対話が当時のムードを想起させると述べています。現状では長時間音声の処理や複数ファイルの扱いで手間がかかる点が残り、プロンプト調整などのノウハウが必要だとしています。
報じられている点:
・Geminiは高速モード、思考モード、Proモードの3種類がある。
・Proモードでは高度な数学処理やコード生成がカバーされるとされている。
・ブラウザやアプリでWindowsやMacから利用できる。
・1時間超の音声認識に課題があり、ファイル分割や個別処理が必要になった事例がある。
・生成画像・動画は可能だが、有料プランでも回数制限がある場合がある。
・クラウドAIのチャット性能は端末差がほとんどなく、古いPCでも利用に大きな差は出ないと述べられている。
まとめ:
記事は、Geminiの機能強化と同時に現時点での運用上の制約やノウハウの必要性を指摘しています。端末性能よりもプロンプト設計や処理の分割といった使い方が鍵になるとの見方が示されており、今後の改善や公式の追加発表が注目されるとしています。現時点では具体的な日程等の言及はありません。
