Qdrantの新サービスでAI開発がもっと身近に?「Cloud Inference」をわかりやすく解説!
こんにちは、AI技術ブロガーのジョンです!最近、AIを使った便利なアプリやサービスがどんどん増えていますよね。でも、「AIアプリの開発って、専門家じゃないと難しいんじゃないの?」と思っている方も多いかもしれません。そんな中、AI開発のハードルをぐっと下げてくれる、画期的な新サービスが登場しました。それが、今回ご紹介する「Qdrant Cloud Inference」です。
そもそも「Qdrant」って何?
まず、「Qdrant(クアドラント)」について簡単にご説明しますね。Qdrantは、「ベクトルデータベース」と呼ばれる、ちょっと特殊なデータベースを提供している会社です。
「ベクトルデータベースって何?」となりますよね。大丈夫です、難しくありません!
AIは、私たちが使う言葉や画像をそのまま理解することはできません。そこで、テキストや画像といったデータを、AIが理解できる「数値の羅列(これをベクトルや埋め込み:Embeddingと呼びます)」に変換する必要があります。
この「ベクトル」は、データの意味や特徴を数字で表現したものです。例えば、「犬」と「猫」のベクトルは近くに、「犬」と「車」のベクトルは遠くに配置される、といったイメージです。
そして、このベクトルを大量に保存し、似ているものを高速で探し出すための専用の保管庫が「ベクトルデータベース」というわけです。
新サービス「Qdrant Cloud Inference」のすごいところ
さて、本題の「Qdrant Cloud Inference」です。このサービスの最大のポイントは、「データのベクトル化」と「ベクトルの検索」という2つの作業を、たった一つの命令で完結させてしまう点にあります。
これまでのAI開発の流れを、少し見てみましょう。
▼これまでの方法
- 開発者はまず、テキストや画像をベクトルに変換するための別のツールを用意する。
- そのツールでデータをベクトルに変換する。
- 変換したベクトルを、Qdrantのようなベクトルデータベースに送って保存する。
- ようやくデータベースに検索をかける。
このように、複数のステップが必要で、手間がかかっていました。
ところが、「Qdrant Cloud Inference」を使えば、このプロセスが劇的にシンプルになります。
▼新しい方法(Qdrant Cloud Inference)
- 開発者は、元のデータ(テキストや画像)をQdrantに送るだけ。
たったこれだけで、Qdrantが内部で自動的にデータをベクトル化し、保存し、検索可能な状態にしてくれるんです。記事によると、これは「1回のAPIコール(サービスへの命令)」で完了するとのこと。
これにより、開発者は以下のようなメリットを得られます。
- ワークフローがシンプルになる:面倒な手作業や、複数のツールを管理する必要がなくなります。
- 開発がスピードアップする:開発サイクルが短縮され、より速くアプリを作れます。
- インフラが不要になる:ベクトル化のためだけに別のサーバーなどを用意する必要がありません。
QdrantのCEO兼共同創設者であるアンドレ・ザヤルニ氏も、「これまでは、埋め込み生成とベクトル検索は別々に扱われていました。しかし、Qdrant Cloud Inferenceを使えば、まるで一つのツールのように感じられます」とコメントしています。
これで何ができるようになるの?
このサービスを使うことで、次のような高度なAIアプリケーションの開発が簡単になります。
- マルチモーダル検索:これは、テキストと画像など、異なる種類のデータを組み合わせて検索する技術です。例えば、「この写真に似ていて、かつ『青空』というキーワードに合う画像を探す」といった複雑な検索が実現しやすくなります。
- 検索拡張生成(RAG):最近よく聞くようになった技術ですね。AIチャットボットなどが、より正確で信頼性の高い回答を生成するための仕組みです。ユーザーから質問を受けると、AIはまずQdrantのようなベクトルデータベースから関連情報を検索し、その情報に基づいて回答を作成します。これにより、AIが不確かな情報や嘘(ハルシネーション)を答えてしまうのを防ぐことができます。
- ハイブリッド検索:複数の異なる検索方法を組み合わせて、より精度の高い検索結果を得る手法です。
利用できるモデルや提供状況について
「Qdrant Cloud Inference」では、データをベクトル化するために、以下のような有名なモデル(AIツール)がサポートされています。
- MiniLM
- SPLADE
- BM25
- Mixedbread Embed-Large
- CLIP(画像とテキスト両方に対応)
今後、さらに多くのモデルが追加される予定だそうです。
料金面では、毎月モデルごとに最大500万トークン(AIが処理するデータの単位)が無料で提供されるという嬉しいプランもあります(BM25モデルは無制限です)。
ただし、現時点(2024年7月15日発表時点)では、アメリカのリージョン(地域)にある有料クラスターでのみ利用可能とのこと。他の地域でのサポートも近日中に予定されているそうです。
僕(ジョン)個人の感想ですが、このように複雑なAI技術を手軽に扱えるようにするサービスが登場するのは、本当に素晴らしいことだと感じます。これまでは大企業や専門チームでなければ難しかったような開発が、個人や小規模なチームでも挑戦しやすくなるからです。この流れが、さらに独創的で面白いAIアプリの誕生につながっていくのかと思うと、ワクワクしますね。
この記事は、以下の元記事をもとに筆者の視点でまとめたものです:
Qdrant Cloud adds service for generating text and image
embeddings