Gemini Embedding 2を初心者向けに噛み砕くスレ

Gemini Embedding 2の発表を入口に、AIがよく分からない人でもembeddingの基礎から追える流れにした教育系スレです。公式ソースを適宜貼りながら、用語を噛み砕いて進みます。

Gemini Embedding 2の発表をきっかけに、embeddingとは何か、何に使うのか、なぜ新しいのかを初心者目線で会話形式で学べるスレ。

2026/03/14 09:3280レス

1名無しさん2026/03/11(水) 00:03:11ID:EMB226OP

最近発表されたGemini Embedding 2について学ぶスレや
AIよう分からん民でも embedding って何やねんから入れるようにしたい
まず発表ニュース
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2/

公式の埋め込み解説
https://ai.google.dev/gemini-api/docs/embeddings

モデルページ
https://ai.google.dev/gemini-api/docs/models/gemini-embedding-2-preview

Vertex AI 側の仕様
https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/embedding-2

旧モデルの整理
https://ai.google.dev/gemini-api/docs/deprecations

2名無しさん2026/03/11(水) 00:03:42ID:Wk3r7mL9

embeddingって単語の時点で帰りたい

3名無しさん2026/03/11(水) 00:04:09ID:Qb2pYzX1

ワイも
なんか英語で威圧してくる

4名無しさん2026/03/11(水) 00:04:44ID:EMB226OP

めっちゃ雑に言うと
文章や画像の「意味」を数字の座標に変える技術や

5名無しさん2026/03/11(水) 00:05:02ID:4nW8uKc2

急に座標って言われても怖い

6名無しさん2026/03/11(水) 00:05:37ID:EMB226OP

例えば
「ラーメン食べたい」
「腹減ったから麺類ほしい」
は言い方ちゃうけど意味近いやん
embeddingはそれを近い場所に置こうとする

7名無しさん2026/03/11(水) 00:06:08ID:Zp0vDkE4

あー
単語一致じゃなくて意味の近さで探せる感じか

8名無しさん2026/03/11(水) 00:06:26ID:EMB226OP

せや
キーワード検索やと「ラーメン」が書いてないと弱い
embedding検索やと意味が近ければ拾いやすい

9名無しさん2026/03/11(水) 00:06:59ID:cU5mN8a7

辞書というより脳内の雰囲気で近づけるんやな

10名無しさん2026/03/11(水) 00:07:29ID:yM1gP4t2

じゃあ生成AIそのものとは別物なんか

11名無しさん2026/03/11(水) 00:08:01ID:EMB226OP

別役やな
生成AIは文章を作る係
embeddingは意味で探す係
同じAI畑でも仕事が違う

12名無しさん2026/03/11(水) 00:08:33ID:3sHkGqR8

野球で言うと
生成AIが実況で embeddingがスカウトの地図みたいなもんか

13名無しさん2026/03/11(水) 00:09:03ID:EMB226OP

割とええ例えや
誰が誰に近いタイプかを座標で持つ感じ

14名無しさん2026/03/11(水) 00:09:37ID:Jg8vNcL5

ここまででだいぶ助かる
embeddingって呪文じゃなかったんやな

15名無しさん2026/03/11(水) 00:10:12ID:EMB226OP

今回のGemini Embedding 2で何が新しいかというと
Google公式いわくGeminiアーキテクチャ上の「最初の完全マルチモーダル埋め込みモデル」や
テキストだけやなく画像音声動画 PDF文書まで同じ意味空間に置ける

16名無しさん2026/03/11(水) 00:10:49ID:r9Vx2nB1

同じ意味空間ってなんや
また強そうな単語出てきたぞ

17名無しさん2026/03/11(水) 00:11:24ID:EMB226OP

画像も文章も音声も
全部「意味の座標」に変換して
同じ地図の上で近い遠いを見られるってことや

18名無しさん2026/03/11(水) 00:11:53ID:EMB226OP

公式モデル説明にも
text image video audio PDF を single unified embedding space に入れるってある
https://ai.google.dev/gemini-api/docs/models/gemini-embedding-2-preview

19名無しさん2026/03/11(水) 00:12:21ID:tR6vLwM0

つまり
「夕焼けの海の写真」を文章で探せるんか

20名無しさん2026/03/11(水) 00:12:53ID:EMB226OP

それがまさに強みや
文章クエリで画像探す
画像から関連文書探す
動画から音声説明に近い場面探す
みたいなのがやりやすくなる

21名無しさん2026/03/11(水) 00:13:27ID:6eA7kVq3

便利そうやけどワイの生活にはまだ遠い気もする

22名無しさん2026/03/11(水) 00:14:04ID:EMB226OP

身近な例で言うと
社内資料検索
FAQ検索
ECの商品おすすめ
写真整理
カスタマーサポートの関連文書引き当て
この辺や

23名無しさん2026/03/11(水) 00:14:35ID:9kLp2uS6

あー
検索窓の賢さ上げる基盤なんやな

24名無しさん2026/03/11(水) 00:15:01ID:EMB226OP

せや
表から見えるのは「探しやすい」
裏でやってるのが embedding や

25名無しさん2026/03/11(水) 00:15:38ID:Bh4wQmH2

RAGって単語もよう見るけど
あれと何が関係あるんや

26名無しさん2026/03/11(水) 00:16:14ID:EMB226OP

RAGは
まず手元の資料を探して
その結果を生成AIに読ませて答えさせる仕組みや
その「まず探す」の主力が embedding

27名無しさん2026/03/11(水) 00:16:47ID:xD2sQeN9

つまり生成AIだけだと記憶あいまいやから
資料係を横に置く感じか

28名無しさん2026/03/11(水) 00:17:20ID:EMB226OP

そうそう
しかも公式の埋め込みドキュメントでも
RAGは代表的ユースケースとして挙がっとる
https://ai.google.dev/gemini-api/docs/embeddings

29名無しさん2026/03/11(水) 00:17:58ID:Vf7mAzS4

ここまで分かった
でも数字のベクトルになる意味あるんか
文字のままじゃだめなん

30名無しさん2026/03/11(水) 00:18:38ID:EMB226OP

文字のままやと
表記ゆれ言い換え他言語に弱い
数字の座標にしとくと
距離計算で意味の近さを高速に扱いやすい

31名無しさん2026/03/11(水) 00:19:15ID:nLm8XgA7

距離計算って高校数学の気配がするので逃げます

32名無しさん2026/03/11(水) 00:19:46ID:EMB226OP

安心せえ
利用者は「近いものを探す」で足りる
中で cosine similarity とか使うことが多いけど
概念としては「向きが似てると近い」くらいでええ

33名無しさん2026/03/11(水) 00:20:14ID:EMB226OP

Google Cloudの解説でも
ベクトルは正規化されてて cosine similarity dot product Euclidean distance で同じ順位付けができるとある
https://cloud.google.com/vertex-ai/generative-ai/docs/embeddings/get-text-embeddings

34名無しさん2026/03/11(水) 00:20:52ID:oJ2mRaU1

急に三すくみみたいな単語出たけど
要は比べ方があるって話やな

35名無しさん2026/03/11(水) 00:21:29ID:EMB226OP

せや
ワイらは「似てる順に並べる方法がある」で十分や

36名無しさん2026/03/11(水) 00:22:06ID:1aNvLrT8

Gemini Embedding 2の数字の大きさってどれくらいなん

37名無しさん2026/03/11(水) 00:22:41ID:EMB226OP

Vertex AIの仕様だと
デフォルトで3072次元のベクトルや
しかも必要なら小さく出すこともできる

38名無しさん2026/03/11(水) 00:23:12ID:Kq8dYxW0

3072次元って聞いた瞬間に人類向きではなくなった

39名無しさん2026/03/11(水) 00:23:46ID:EMB226OP

人類が直接眺めるもんではないからセーフ
大事なんは
情報量をそこそこ持ちつつ比較に使えることや

40名無しさん2026/03/11(水) 00:24:21ID:EMB226OP

発表ブログだと
Matryoshka Representation Learning を使って
3072から縮めても使いやすいようにしてて
3072 1536 768あたりを推奨しとる
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-embedding-2/

41名無しさん2026/03/11(水) 00:24:53ID:5wQmZrS2

マトリョーシカって急にかわいいな

42名無しさん2026/03/11(水) 00:25:26ID:0yTbHcM4

中に小さい意味が入っとるんか

43名無しさん2026/03/11(水) 00:26:00ID:EMB226OP

イメージとしては近い
大きいベクトルの先頭側に
重要な情報をうまく詰めて
小さく切っても実用になりやすくする発想や

44名無しさん2026/03/11(水) 00:26:37ID:Yz4kLqB9

保存コストとか速度にも効きそうやな

45名無しさん2026/03/11(水) 00:27:10ID:EMB226OP

そこや
発表でも性能と保存コストのバランスを取りやすい言うとる
でかいほど雑に強いが
小さくするとストレージや検索コストが軽くなる

46名無しさん2026/03/11(水) 00:27:48ID:R8uVf3N7

じゃあ全部3072にしとけば勝ちではないんやな

47名無しさん2026/03/11(水) 00:28:18ID:EMB226OP

勝ち筋は用途次第やな
精度最優先なら大きめ
件数めっちゃ多いなら軽量化も考える

48名無しさん2026/03/11(水) 00:28:55ID:mQ7dKeE1

ところで前のGemini embeddingって何やったん

49名無しさん2026/03/11(水) 00:29:31ID:EMB226OP

ここ大事
Gemini API公式ドキュメントでは
最新は gemini-embedding-2-preview
一方で text-only用途なら gemini-embedding-001 も引き続きある
つまり全部が即座に置き換わるというより
「マルチモーダルの新しい本命が来た」理解でええ

50名無しさん2026/03/11(水) 00:30:10ID:Ht9bLwP3

じゃあ古い text-embedding-004 はどうなったんや

51名無しさん2026/03/11(水) 00:30:44ID:EMB226OP

公式の deprecations ページだと
text-embedding-004 は 2026-01-14 で停止済み扱いや
推奨置き換え先は gemini-embedding-001 になっとる
https://ai.google.dev/gemini-api/docs/deprecations

52名無しさん2026/03/11(水) 00:31:17ID:2qHcXvM8

わりと最近整理されたんやな

53名無しさん2026/03/11(水) 00:31:52ID:EMB226OP

せや
その流れの上で今回 Embedding 2 が来たから
「Googleの埋め込み系がマルチモーダルに一段進んだ」と見ると分かりやすい

54名無しさん2026/03/11(水) 00:32:25ID:Uo7pZfB2

対応言語どうなん
英語専用みたいなの嫌やで

55名無しさん2026/03/11(水) 00:32:58ID:EMB226OP

公式ブログと埋め込みDocsでは
100以上の言語で意味を捉える方向で説明されとる
多言語検索に向いとるのはかなりデカい

56名無しさん2026/03/11(水) 00:33:31ID:7dXqNnC1

日本語資料を英語クエリで探すとかも夢ではないんか

57名無しさん2026/03/11(水) 00:34:05ID:EMB226OP

理屈上はそこが狙いや
もちろんデータ次第で精度差はあるけど
単純な単語一致より希望がある

58名無しさん2026/03/11(水) 00:34:43ID:Lo6vPqS8

動画とか音声まで入ると
会議録の検索も賢くなりそうやな

59名無しさん2026/03/11(水) 00:35:11ID:EMB226OP

せやな
例えば
「予算削減の話してた場面どこ？」
を動画や音声から探す系がやりやすくなる

60名無しさん2026/03/11(水) 00:35:46ID:EMB226OP

Vertex AIの仕様ページには
画像テキスト文書音声動画を受けて3072次元にするって明記されとる
しかもPDFはOCRも読む説明がある
https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/embedding-2

61名無しさん2026/03/11(水) 00:36:18ID:Fh3kQvL0

PDF読めるの地味にありがたい
会社の知識ってだいたいPDFに封印されてるし

62名無しさん2026/03/11(水) 00:36:53ID:pU2nKeM6

封印というか呪物定期

63名無しさん2026/03/11(水) 00:37:25ID:EMB226OP

あと初心者向けに誤解を潰すと
embeddingは「答えを生成する魔法」ではない
「関連するものを見つける地図」や
ここ混ざると理解が崩れる

64名無しさん2026/03/11(水) 00:38:01ID:gN8sLmT7

生成AIが作文担当
embeddingが資料係
これで覚えるわ

65名無しさん2026/03/11(水) 00:38:38ID:EMB226OP

かなり正しい
しかも資料係が有能だと
作文担当の答えもだいぶマシになる
だからRAGで重要なんや

66名無しさん2026/03/11(水) 00:39:16ID:Vq5rTbM2

実装する側は何を気をつけるんや

67名無しさん2026/03/11(水) 00:39:55ID:EMB226OP

初心者向けに3つだけ
1 何を探したいか決める
2 データをちゃんと分割して入れる
3 精度とコストで次元数を選ぶ
あと用途指定の設定を使うと精度改善しやすい
埋め込みDocsにも task type の話がある
https://ai.google.dev/gemini-api/docs/embeddings

68名無しさん2026/03/11(水) 00:40:28ID:sJ4mYpA9

「何でも入れたら賢くなる」は違うんやな

69名無しさん2026/03/11(水) 00:41:00ID:EMB226OP

せや
ゴミの山を高級ベクトルにしても
高級なゴミの地図ができるだけや

70名無しさん2026/03/11(水) 00:41:33ID:Ar7vQnE5

言い方だけ妙に刺さるのやめろ

71名無しさん2026/03/11(水) 00:42:06ID:EMB226OP

ついでに仕様面の小ネタ
Vertex AIページでは最大入力 8192トークンって出とる
長文でもそこそこ扱えるが
無限ではないから分割戦略は大事や
https://cloud.google.com/vertex-ai/generative-ai/docs/models/gemini/embedding-2

72名無しさん2026/03/11(水) 00:42:42ID:hC2mNxQ1

結局チャンク分割大事になるんやな
AI界ずっと刻んでる気がする

73名無しさん2026/03/11(水) 00:43:11ID:EMB226OP

刻み方で検索精度かなり変わるからな
段落ごと
見出しつき
会話ターンごと
この辺は用途で変える

74名無しさん2026/03/11(水) 00:43:48ID:Kl9fVwE6

ここまでで
Embedding 2は「何でも分かる超知能」ではなく
「いろんな形式を同じ意味地図に置ける検索基盤」って理解でええか

75名無しさん2026/03/11(水) 00:44:17ID:EMB226OP

その理解でかなりええ
しかもGoogle公式発表上は
Public PreviewでGemini APIとVertex AIから使える
だから今後この系統の土台として触る人は増えそうや

76名無しさん2026/03/11(水) 00:44:49ID:jW3vTqC8

初心者ワイ
embeddingをようやく「検索のための意味座標化」として脳に格納

77名無しさん2026/03/11(水) 00:45:18ID:EMB226OP

今日のまとめ
embedding ＝意味を座標にする
RAG ＝その座標で資料を探してから答える
Gemini Embedding 2 ＝テキストだけやなく画像音声動画 PDFまで同じ地図に乗せる新しいGoogleの埋め込みモデル

78名無しさん2026/03/11(水) 00:45:53ID:bM8rLcZ4

ワイの理解
「検索の裏で働く地味やけど重要なやつ」が主役回をもらった

79名無しさん2026/03/11(水) 00:46:22ID:EMB226OP

だいたいそれ
派手なのは生成やけど
現場で効くのは案外こっちや

80名無しさん2026/03/11(水) 00:46:59ID:dP7xQaM1

つまりAI界の守備職人やな
打率よりUZRで語られるタイプ

前後のスレ

前の記事【急募】ワイのマンションの掲示板の注意書き、47枚あるんやが

築32年のマンション掲示板に貼られた47枚の注意書き。全部あまりにも具体的で、過去に何があったのか誰も語らない。

次の記事ボンボンドロップシール、文具屋が試される

人気シール「ボンボンドロップシール」が品薄化。大人も子どもも参戦して、売り場の空気だけ重くなっている。

ニュース・時事

Gemini Embedding 2を初心者向けに噛み砕くスレ

前後のスレ

関連記事

【朗報】高市首相、ついにトランプにカチコミへ

ChatGPTの無制限、無制限じゃなくなるかも

【朗報】Starfieldさん、ついにPS5で発売決定してしまう

【朗報】経産省「フィジカルAI」を国産化へ。日本の現場がついに変わるぞ