コンテンツへスキップ

Qdrant Cloud: テキストと画像エンベディング生成の新時代

Qdrant Cloud Inference: Supercharge Your Apps with Integrated AI Embeddings

Qdrantの新サービスでAI開発がもっと身近に?「Cloud Inference」をわかりやすく解説!

こんにちは、AI技術ブロガーのジョンです!最近、AIを使った便利なアプリやサービスがどんどん増えていますよね。でも、「AIアプリの開発って、専門家じゃないと難しいんじゃないの?」と思っている方も多いかもしれません。そんな中、AI開発のハードルをぐっと下げてくれる、画期的な新サービスが登場しました。それが、今回ご紹介する「Qdrant Cloud Inference」です。

そもそも「Qdrant」って何?

まず、「Qdrant(クアドラント)」について簡単にご説明しますね。Qdrantは、「ベクトルデータベース」と呼ばれる、ちょっと特殊なデータベースを提供している会社です。

「ベクトルデータベースって何?」となりますよね。大丈夫です、難しくありません!
AIは、私たちが使う言葉や画像をそのまま理解することはできません。そこで、テキストや画像といったデータを、AIが理解できる「数値の羅列(これをベクトル埋め込み:Embeddingと呼びます)」に変換する必要があります。

この「ベクトル」は、データの意味や特徴を数字で表現したものです。例えば、「犬」と「猫」のベクトルは近くに、「犬」と「車」のベクトルは遠くに配置される、といったイメージです。
そして、このベクトルを大量に保存し、似ているものを高速で探し出すための専用の保管庫が「ベクトルデータベース」というわけです。

新サービス「Qdrant Cloud Inference」のすごいところ

さて、本題の「Qdrant Cloud Inference」です。このサービスの最大のポイントは、「データのベクトル化」と「ベクトルの検索」という2つの作業を、たった一つの命令で完結させてしまう点にあります。

これまでのAI開発の流れを、少し見てみましょう。

▼これまでの方法

  1. 開発者はまず、テキストや画像をベクトルに変換するための別のツールを用意する。
  2. そのツールでデータをベクトルに変換する。
  3. 変換したベクトルを、Qdrantのようなベクトルデータベースに送って保存する。
  4. ようやくデータベースに検索をかける。

このように、複数のステップが必要で、手間がかかっていました。

ところが、「Qdrant Cloud Inference」を使えば、このプロセスが劇的にシンプルになります。

▼新しい方法(Qdrant Cloud Inference)

  1. 開発者は、元のデータ(テキストや画像)をQdrantに送るだけ。

たったこれだけで、Qdrantが内部で自動的にデータをベクトル化し、保存し、検索可能な状態にしてくれるんです。記事によると、これは「1回のAPIコール(サービスへの命令)」で完了するとのこと。

これにより、開発者は以下のようなメリットを得られます。

  • ワークフローがシンプルになる:面倒な手作業や、複数のツールを管理する必要がなくなります。
  • 開発がスピードアップする:開発サイクルが短縮され、より速くアプリを作れます。
  • インフラが不要になる:ベクトル化のためだけに別のサーバーなどを用意する必要がありません。

QdrantのCEO兼共同創設者であるアンドレ・ザヤルニ氏も、「これまでは、埋め込み生成とベクトル検索は別々に扱われていました。しかし、Qdrant Cloud Inferenceを使えば、まるで一つのツールのように感じられます」とコメントしています。

これで何ができるようになるの?

このサービスを使うことで、次のような高度なAIアプリケーションの開発が簡単になります。

  • マルチモーダル検索:これは、テキストと画像など、異なる種類のデータを組み合わせて検索する技術です。例えば、「この写真に似ていて、かつ『青空』というキーワードに合う画像を探す」といった複雑な検索が実現しやすくなります。
  • 検索拡張生成(RAG):最近よく聞くようになった技術ですね。AIチャットボットなどが、より正確で信頼性の高い回答を生成するための仕組みです。ユーザーから質問を受けると、AIはまずQdrantのようなベクトルデータベースから関連情報を検索し、その情報に基づいて回答を作成します。これにより、AIが不確かな情報や嘘(ハルシネーション)を答えてしまうのを防ぐことができます。
  • ハイブリッド検索:複数の異なる検索方法を組み合わせて、より精度の高い検索結果を得る手法です。

利用できるモデルや提供状況について

「Qdrant Cloud Inference」では、データをベクトル化するために、以下のような有名なモデル(AIツール)がサポートされています。

  • MiniLM
  • SPLADE
  • BM25
  • Mixedbread Embed-Large
  • CLIP(画像とテキスト両方に対応)

今後、さらに多くのモデルが追加される予定だそうです。

料金面では、毎月モデルごとに最大500万トークン(AIが処理するデータの単位)が無料で提供されるという嬉しいプランもあります(BM25モデルは無制限です)。
ただし、現時点(2024年7月15日発表時点)では、アメリカのリージョン(地域)にある有料クラスターでのみ利用可能とのこと。他の地域でのサポートも近日中に予定されているそうです。

僕(ジョン)個人の感想ですが、このように複雑なAI技術を手軽に扱えるようにするサービスが登場するのは、本当に素晴らしいことだと感じます。これまでは大企業や専門チームでなければ難しかったような開発が、個人や小規模なチームでも挑戦しやすくなるからです。この流れが、さらに独創的で面白いAIアプリの誕生につながっていくのかと思うと、ワクワクしますね。

この記事は、以下の元記事をもとに筆者の視点でまとめたものです:
Qdrant Cloud adds service for generating text and image
embeddings

関連投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です