こんにちは。クラウドソリューション事業部の本田です。先日開催されましたAWS re:Invent 2023ですが、現地で参加してきました。Keynoteまとめ第二弾で、AWS副社長のDr. Swami SivasubramanianによるKeynoteをまとめていこうと思います。
データ、AI、人間の共生
生成系AIはデータによって強化され、それは自然界にある共生の概念と似ていると述べられていました。また人間は強化された生成系AIをうまく使うことでそれぞれ有益な関係にあると述べていました。データは生成系AIによって活かされ、生成系AIはデータによって強化され、生成系AIは人間によって活かされ、そして人間は生成系AIによって創造性を発揮できている、といったところでしょうか。
・生成系AIは自然界に見られるような共生関係を形成することで、人間の働き方やイノベーションの方法に革命をもたらしつつある
・AWSはAIアプリケーションの開発と展開に不可欠なツールとインフラを提供している
・AWSの生成系AIプラットフォームは、MLモデルの構築、トレーニング、デプロイのためのAmazon SageMaker、主要モデルへのアクセスとAIアプリケーションのスケーリングのためのAmazon Bedrock、そして専門知識なしで生成系AIを利用するためのAmazon Qのようなのアプリケーションの3つのレイヤーで構成されている
・Anthropics社のClaude2.1のサポートが発表された
・AWSは、虚偽の発言やオープンエンドな会話の減少、システムプロンプトの改善、BedrockのLLAMA 270Bのような一般に公開されているモデルのサポートなど、AIモデルの改善を行った
Amazon Titan
AWSによって大規模なデータセットで事前トレーニングされた基盤モデルであるAmazon Titanの新サービスが多く発表されました。画像の生成、文章の要約やチャットなど利用ケースとしてはわかりやすいケースが多く普段の仕事においても有効活用できそうです。
・Amazonは25年以上にわたってAI/ML技術に投資しており、検索やパーソナライズ体験を強化するためのベクトル埋め込み技術の利用など、主要な学習成果を顧客と共有している
・Titan Multimodal Embeddingsの一般提供を発表し、開発者がアプリケーションに対してよりリッチなマルチモーダル検索とレコメンデーションオプションを作成することを可能にし、構築を容易にし、顧客体験を向上させることができる
・Titan、Text Lite、Titan Text Expressなど、様々なテキスト生成モデルを提供し、チャットボット、Q&A、テキスト要約、自由形式のテキスト生成など、様々なユースケースに対応できる
・Titan Image Generatorをリリースし顧客は高品質でリアルな画像を簡単に作成することができ、人間の評価による有害性や偏向性を緩和する機能が組み込まれている
・実際にイグアナ画像を使って向きを変えたり、背景を変えたりする例が提示された
・ 顧客にAIモデルの選択と使用における柔軟性を提供しており、1万社以上の顧客が様々なユースケース向けにAIを活用したアプリケーションを急速に開発している
事例:INTUIT社
事例としてINTUIT社の副社長が登場し、AWSを活用してAI/MLと生成系AIを強化し、1億人の顧客にパーソナライズされた体験を提供をしていることを述べました。
・INTUITは過去10年にわたりAWSを活用し、AI/MLと生成系AIに注力し、1億人の消費者と中小企業の顧客の繁栄を支え、1日あたり650億件の機械学習による予測を可能に
・Genomics on AWSと呼ばれる独自のGenAIオペレーティングシステムを開発し、新しいGenAI体験を構築するためのGen Studio、スケーラビリティとデータへのアクセスのためのGen Runtime、一貫性のためのGen Xなどを開発している
顧客体験のためのユニークなAIアプリケーションを作成するために、データと基礎モデルを活用することの重要性を示している。
・ Amazon Bedrockの検索拡張世代(RAG)とエージェントを使用することで、ビジネスに特化したアプリケーションを構築することができる
独自データを使った検索拡張生成(RAG)
検索の元となるデータを企業や業界に独自のデータにすることができることが述べられました。企業によって持っているデータは違いますし、また汎用的なものではなくその企業に適したアプリケーションでないとメリットを得れないことがあります。そこで独自データをデータソースとして、それにアクセスできるようにして企業に適したアプリケーションを作ることができます。
・ビジネスに適したの生成系AIアプリを作成するために重要なのはデータ
・Knowledge Bases for Amazon Bedrockの発表
・例えばS3に企業情報、業界情報など独自のデータを入れることで検索拡張生成(RAG)が可能となる
・Amazon Bedrockの検索拡張生成(RAG)とAgents for Bedrockを使用することで、ビジネスに特化したアプリケーションを構築することができる
・今後データソースとしてAurora、MongoDBなども増えることを予定している
生成系AIを使った顧客体験のパーソナライズ化
顧客にパーソナライズされた体験の例として仮想のDIYビジネスRAD DIYを使って具体例が示されました。DIYを通じで顧客が直面する課題を顧客の状況や作りたいものに合わせて解決策や方法を提示してくれるというイメージでした。画一的な対応ではなく顧客によって対応が変わるのは以前ではその分従業員が必要だったかと思いますが、生成系AIによって少ないリソースで多くの人を対象にビジネスが展開できますね。高性能GPUソリューションのためにNVIDIAと提携し、分散トレーニングのためのSagemaker Hyper Podsが発表されました。
・Amazon Bedrock上のClaude 2を使った生成系AIアシスタントを搭載したRAD DIYという仮想のDIYビジネスを使って、具体的に生成系AIをビジネスに利用するか紹介
・正確でわかりやすい手順を提供し、プロジェクト画像を生成し、必要な製品を検索し、ユーザーレビューを要約することで、顧客のDIYプロジェクトを支援してくれる
・ 生成系AIアプリケーションを構築するためのBedrockプラットフォームを提供し、またAWS GenAIイノベーションセンターを通じて、独自のデータを使ってビジネスニーズに合わせてClaudeモデルをカスタマイズするための新しいプログラムを含むハンズオンサポートも提供
・エヌビディアと提携し、ディープラーニングワークロード向けの高性能GPUソリューションを提供
・顧客がMLモデルの構築、トレーニング、デプロイを容易にするため、独自のMLチップとソフトウェアツールにも投資
・Sagemaker Hyper Podsが発表され推論、トレーニング、MLOpsのためのSagemakerの新機能とともに、モデルのトレーニング時間を最大40%短縮できると発表された
・Perplexityは、引用を用いた直接的な回答を提供する会話型回答エンジンで、パーソナライズされた的確な回答を提供するために検索を再構築している
データのベクトル化
AWSはAIモデルを改良し、APIとして生成系AIを提供し、様々なデータソースにベクトル検索を導入してパフォーマンスを向上させています。このベクトル検索が生成系AI、機械学習において重要であると自分は理解できました。データをベクトル化することによって類似性、関連性の検索ができるようになるわけです。
・生成系AIモデルは現在、AWS上のAPIとして提供されており、消費者のためのテクノロジーに革命を起こし、新しい製品体験と競争力のある価格を提供することを目指している
・強力なデータ基盤を構築することは、生成系AIにとって重要であり、データを管理するための包括的で統合されたサービスやツールのセットを必要とする
・AWSは、データベースサービス、データレイク、データウェアハウス、MLおよびAIツール、洞察を提供しデータを管理するためのサービスなど、さまざまな種類のデータを保存、整理、アクセス、操作するための包括的なツール群を提供している
・Amazon Aurora、Amazon RDS、OpenSearch Serviceなど、一般的なデータソースにベクトル機能を追加し、既存サービスのパフォーマンス高速化にも投資してきた
・DocumentDBとDynamoDBにベクトル機能を導入し、MemoryDB for Redisにベクトル検索をプレビュー提供することを発表
・Amazon NeptuneにNeptune Analyticsの一般提供を発表し、データサイエンティストやアプリ開発者が大量のグラフデータをより簡単かつ迅速に分析できようになると発表
zero-ETLでのデータ結合
ここから話はzero-ETLの話題になりました。良い顧客体験のためにはデータが必要ですが、分析のために使われるデータはさまざまな場所に保存されています。それらをETLなく、zero-ETLで結合して利用できる未来について語っています。
・異なるソース間でデータを統合し、より良い顧客体験を創造し、ほぼリアルタイムの分析のためのゼロETL統合を活用する。
・Amazon OpenSearchとS3とをzero-ETL統合を実現したAmazon OpenSearch Service zero-ETL Integration with Amazon S3
・ETLパイプラインを必要とせず、すべてのログデータを一箇所でシームレスに検索、分析、可視化できる
・Amazon DataZoneは、組織内のデータのカタログ化、発見、共有、管理を支援するデータ管理サービスであり、従業員のコラボレーションとビジネスのための洞察の促進を可能にするほか、AWSを通じて特定のパートナーとの安全なデータ共有を可能にする
事例:Booking.com
Booking.comのCTOが登場し、自社サービスにおけるデータ処理の改善と生成系AIの利用について語ります。その人に適した予約内容を薦めるために利用されているようです。
・AI旅行プランナーにLLAMA 2モデルを導入し、顧客のプライバシーとデータ保護を優先しつつ、会話による旅行予約を促進している
・AWSの技術を活用し、レビューデータを取り込み、レコメンデーションエンジン用のJSONオブジェクトを作成し、旅行者に最適な選択肢と便利な予約体験を提供している
・データは生成系AIの燃料であり、AIとMLをデータサービス全体に浸透させることで、データ管理とアナリティクスをより簡単に、より直感的に、よりアクセスしやすくするだけでなく、パフォーマンスを最適化し、ビジネスの様々な分野でデータ管理をサポートすることで、データ基盤にも利益をもたらすことができる
AIを使った人間の能力向上
ここからはAWS CEOのKeynoteで話題になったAmazon Qのお話になります。Amazon Qを使って自然言語からSQLを自動生成するなど、コードを書けない人でも簡単に検索ができるそんなデモも紹介されていました。またアフリカにおけるガン治療の話やトヨタの安全性の向上など、AI活用の例も挙げられています。
・Amazon Qが自然言語プロンプトやレコメンデーションを使用することで、データクエリや統合タスクをどのように簡素化し、最終的にデータ統合やデータによるストーリーテリングの高速化を可能にする
・ AWSサービスを使って、様々なソースからのデータを簡単に統合・分析し、従来のETLパイプラインやコードを書く必要なく、新機能の成功を測定するためのビジュアルダッシュボードやデータストーリーを作成する
・Amazon Q generative SQL in Amazon Redshiftを使って、自然言語からSQLを生成できる
・データとAIは、がん医療に革命を起こし、アフリカの患者の治療アクセスを改善するために利用されている
・Amazon CodewhispererのようなツールやAIを活用したコーディングに投資して生産性を加速
・トヨタは生成系AIを使って安全性を向上させ、顧客のための支援体験を創造している
・人間、データ、生成AIの関係は、パナマの熱帯雨林におけるビローラの木、オオハシ、アグーチの共生関係に似ている
・Amazon Bedrockは、顧客が特定のニーズに最適な基盤モデルを評価・選択しやすくするため、モデル評価の新機能を導入した
・AWSは、AIとMLの未来に向けて労働力を準備するための奨学金やトレーニングプログラムを提供
・生成系AIを身近に楽しく学べるParty Rockのようなツールを導入
まとめ
Keynoteの冒頭と最後に語られた、データ、AI、人間の共生がとても印象に残っています。データがあるからAIを使うことででき、そのAIによって人類の能力が向上しより多くのことが実現できるようになる。そんな未来が少し見えたような気がします。どんな企業もデータは持っていますし、それが企業間での違いになります。それらをうまく使って顧客により良い体験を提供できるか否かが今後のビジネスの成功を左右するのでは、と思いました。弊社でもデータは色々と持っていると思うので有効活用していきたいです。