Qdrant Cloudがテキストと画像エンベディングサービスを追加

Table of Contents

Qdrantの新サービスでAI開発がもっと身近に？「Cloud Inference」をわかりやすく解説！

こんにちは、AI技術ブロガーのジョンです！最近、AIを使った便利なアプリやサービスがどんどん増えていますよね。でも、「AIアプリの開発って、専門家じゃないと難しいんじゃないの？」と思っている方も多いかもしれません。そんな中、AI開発のハードルをぐっと下げてくれる、画期的な新サービスが登場しました。それが、今回ご紹介する「Qdrant Cloud Inference」です。

そもそも「Qdrant」って何？

まず、「Qdrant（クアドラント）」について簡単にご説明しますね。Qdrantは、「ベクトルデータベース」と呼ばれる、ちょっと特殊なデータベースを提供している会社です。

「ベクトルデータベースって何？」となりますよね。大丈夫です、難しくありません！
AIは、私たちが使う言葉や画像をそのまま理解することはできません。そこで、テキストや画像といったデータを、AIが理解できる「数値の羅列（これをベクトルや埋め込み：Embeddingと呼びます）」に変換する必要があります。

この「ベクトル」は、データの意味や特徴を数字で表現したものです。例えば、「犬」と「猫」のベクトルは近くに、「犬」と「車」のベクトルは遠くに配置される、といったイメージです。
そして、このベクトルを大量に保存し、似ているものを高速で探し出すための専用の保管庫が「ベクトルデータベース」というわけです。

新サービス「Qdrant Cloud Inference」のすごいところ

さて、本題の「Qdrant Cloud Inference」です。このサービスの最大のポイントは、「データのベクトル化」と「ベクトルの検索」という2つの作業を、たった一つの命令で完結させてしまう点にあります。

これまでのAI開発の流れを、少し見てみましょう。

▼これまでの方法

開発者はまず、テキストや画像をベクトルに変換するための別のツールを用意する。
そのツールでデータをベクトルに変換する。
変換したベクトルを、Qdrantのようなベクトルデータベースに送って保存する。
ようやくデータベースに検索をかける。

このように、複数のステップが必要で、手間がかかっていました。

ところが、「Qdrant Cloud Inference」を使えば、このプロセスが劇的にシンプルになります。

▼新しい方法（Qdrant Cloud Inference）

開発者は、元のデータ（テキストや画像）をQdrantに送るだけ。

たったこれだけで、Qdrantが内部で自動的にデータをベクトル化し、保存し、検索可能な状態にしてくれるんです。記事によると、これは「1回のAPIコール（サービスへの命令）」で完了するとのこと。

これにより、開発者は以下のようなメリットを得られます。

ワークフローがシンプルになる：面倒な手作業や、複数のツールを管理する必要がなくなります。
開発がスピードアップする：開発サイクルが短縮され、より速くアプリを作れます。
インフラが不要になる：ベクトル化のためだけに別のサーバーなどを用意する必要がありません。

QdrantのCEO兼共同創設者であるアンドレ・ザヤルニ氏も、「これまでは、埋め込み生成とベクトル検索は別々に扱われていました。しかし、Qdrant Cloud Inferenceを使えば、まるで一つのツールのように感じられます」とコメントしています。

これで何ができるようになるの？

このサービスを使うことで、次のような高度なAIアプリケーションの開発が簡単になります。

マルチモーダル検索：これは、テキストと画像など、異なる種類のデータを組み合わせて検索する技術です。例えば、「この写真に似ていて、かつ『青空』というキーワードに合う画像を探す」といった複雑な検索が実現しやすくなります。
検索拡張生成（RAG）：最近よく聞くようになった技術ですね。AIチャットボットなどが、より正確で信頼性の高い回答を生成するための仕組みです。ユーザーから質問を受けると、AIはまずQdrantのようなベクトルデータベースから関連情報を検索し、その情報に基づいて回答を作成します。これにより、AIが不確かな情報や嘘（ハルシネーション）を答えてしまうのを防ぐことができます。
ハイブリッド検索：複数の異なる検索方法を組み合わせて、より精度の高い検索結果を得る手法です。

利用できるモデルや提供状況について

「Qdrant Cloud Inference」では、データをベクトル化するために、以下のような有名なモデル（AIツール）がサポートされています。

MiniLM
SPLADE
BM25
Mixedbread Embed-Large
CLIP（画像とテキスト両方に対応）

今後、さらに多くのモデルが追加される予定だそうです。

料金面では、毎月モデルごとに最大500万トークン（AIが処理するデータの単位）が無料で提供されるという嬉しいプランもあります（BM25モデルは無制限です）。
ただし、現時点（2024年7月15日発表時点）では、アメリカのリージョン（地域）にある有料クラスターでのみ利用可能とのこと。他の地域でのサポートも近日中に予定されているそうです。

僕（ジョン）個人の感想ですが、このように複雑なAI技術を手軽に扱えるようにするサービスが登場するのは、本当に素晴らしいことだと感じます。これまでは大企業や専門チームでなければ難しかったような開発が、個人や小規模なチームでも挑戦しやすくなるからです。この流れが、さらに独創的で面白いAIアプリの誕生につながっていくのかと思うと、ワクワクしますね。

この記事は、以下の元記事をもとに筆者の視点でまとめたものです：
Qdrant Cloud adds service for generating text and image
embeddings

Qdrant Cloud: テキストと画像エンベディング生成の新時代

Qdrantの新サービスでAI開発がもっと身近に？「Cloud Inference」をわかりやすく解説！

そもそも「Qdrant」って何？

新サービス「Qdrant Cloud Inference」のすごいところ

これで何ができるようになるの？

利用できるモデルや提供状況について

関連投稿

コメントを残すコメントをキャンセル

Qdrant Cloud: テキストと画像エンベディング生成の新時代

Qdrantの新サービスでAI開発がもっと身近に？「Cloud Inference」をわかりやすく解説！

そもそも「Qdrant」って何？

新サービス「Qdrant Cloud Inference」のすごいところ

これで何ができるようになるの？

利用できるモデルや提供状況について

関連投稿

コメントを残す コメントをキャンセル

コメントを残すコメントをキャンセル