Bagaimana AI Overview memilih halaman untuk dikutip?

Berdasarkan eksperimen 12 query: AI Overview bekerja dalam 2 stage. Stage 1: candidate selection dari top 10-20 organik (yang ranking di Google biasa). Stage 2: extraction layer pilih paragraf spesifik yang menjawab query langsung. Halaman bisa rank #3 organik tapi tidak dikutip jika paragraf-nya tidak extractable.

Apa yang membuat paragraf 'extractable' untuk AI Overview?

Empat properti: (1) Standalone — paragraf dipahami tanpa context paragraf sebelumnya. (2) Fakta spesifik dengan angka, tanggal, atau entity. (3) Direct answer ke pertanyaan implisit. (4) Length 40-80 kata (paragraph yang terlalu pendek atau panjang sering dilewat). 'Halaman jasa A.' = tidak extractable. 'Jasa A di Tangerang melayani 200+ klien sejak 2018, dengan tarif Rp 5jt/proyek.' = extractable.

Apakah ranking organik tinggi otomatis muncul di AI Overview?

Tidak. Eksperimen menunjukkan halaman #1 organik bisa tidak muncul di AI Overview kalau paragraf tidak extractable. Sebaliknya, halaman #5-#10 organik bisa muncul jika punya paragraf yang clear dan answer-format. Optimization untuk AI Overview adalah extension dari SEO, bukan replacement.

SEO/GEO · Vol. 1

Mekanika sitasi AI Overview — kenapa halaman Anda muncul atau tidak

Reverse-engineering AI Overview: bagaimana model memilih halaman untuk dikutip dari set candidate, dan apa yang menentukan halaman lolos seleksi akhir.

18 Mei 2026 · 10 menit baca · by Reno Adipraja

Saya melakukan eksperimen kecil selama April 2026 untuk memahami lebih baik mekanika sitasi AI Overview. Setup: 12 query informasional di niche yang saya kelola (jasa web design Tangerang, jasa SEO Tangerang, klinik kecantikan BSD, dll). Untuk setiap query, saya catat 3 hal: halaman mana yang dirank top 10 organik, halaman mana yang muncul di AI Overview, dan paragraf mana yang dikutip.

Bukan eksperimen formal — tidak ada kontrol grup, tidak ada randomisasi. Cuma observasi terstruktur. Tapi pola yang muncul cukup konsisten untuk dibagikan.

Pola 1: Tidak semua top 10 masuk Overview

Dari 12 query, rata-rata hanya 2-4 halaman dari top 10 organik yang muncul di Overview. Sisanya tidak. Beberapa halaman di posisi #1 organik bahkan tidak muncul di Overview, sementara halaman di posisi #7 atau #8 muncul.

Ini menggugurkan asumsi umum bahwa “ranking organik tinggi = pasti masuk Overview.” Ranking organik adalah prasyarat (Anda harus di consideration set), bukan penyebab (model masih melakukan seleksi lanjutan).

Pola 2: Halaman yang lolos seleksi punya 3 ciri konsisten

Halaman yang dikutip di Overview, dibandingkan halaman top 10 yang tidak dikutip, secara konsisten memiliki:

a) Paragraf pertama yang langsung menjawab. Tidak ada intro yang panjang. Tidak ada brand storytelling. Lead langsung berisi jawaban yang dapat di-extract.

b) Fakta dengan satuan yang spesifik. Halaman yang menyebut “Rp 3.848.000” lebih sering dikutip daripada halaman yang menyebut “harga mulai jutaan.” Halaman yang menyebut “5 hari kerja” lebih sering daripada “proses cepat.”

c) Struktur heading yang mengikuti pola pertanyaan. H2/H3 yang berupa pertanyaan (“Berapa biaya jasa web design Tangerang?”) lebih sering ter-extract daripada heading deskriptif (“Layanan Kami”).

Pola 3: Sitasi cenderung ke 1 sumber per pertanyaan

Untuk pertanyaan compound (Overview yang menjawab 3-4 sub-pertanyaan), saya melihat pola 1 sitasi per sub-pertanyaan, dari 1 halaman per sumber. Model tidak suka mengutip 2 halaman dari domain yang sama dalam 1 Overview. Implikasinya: jika domain Anda punya halaman pricing dan halaman FAQ yang sama-sama bagus, model akan pilih satu untuk Overview dan menulis sub-pertanyaan kedua dari domain lain.

Praktis: untuk maksimasi sitasi, konsolidasikan informasi terkait dalam satu halaman, bukan menyebarkan ke banyak halaman. Halaman pricing yang juga punya FAQ tentang delivery time mengalahkan dua halaman terpisah.

Pola 4: Anchor link dengan section ID memberikan boost

Halaman yang dikutip sering memiliki anchor link ke section spesifik (e.g. /harga/#paket-launch bukan hanya /harga/). Model tampaknya memilih halaman yang membuatnya mudah untuk men-deep-link langsung ke kalimat yang dikutip.

Praktis: pastikan setiap H2/H3 di halaman Anda punya id yang stable dan deskriptif. Astro dan kebanyakan static site generator melakukan ini otomatis dari heading text. Jangan rusak ini dengan custom heading components yang melewati ID generation.

Pola 5: Speakable schema kelihatannya tidak terlalu penting (untuk sekarang)

Saya menguji 4 halaman dengan Speakable schema markup vs 4 halaman tanpa. Tidak ada perbedaan signifikan dalam tingkat sitasi di periode 60 hari. Mungkin Speakable lebih relevan untuk Voice Search (Google Assistant) daripada AI Overview text.

Tetapi karena Speakable tidak merugikan dan setup-nya 5 menit, saya tetap menyarankan mengaplikasikan ke halaman key untuk hedge.

Pola 6: Update content frequency tampak penting

Halaman yang punya lastUpdated schema dan benar-benar diupdate (bukan hanya touch date) tampak lebih sering dikutip untuk query yang sensitif waktu (“biaya 2026”, “harga terbaru”). Halaman yang lastUpdated-nya 2022 jarang dikutip untuk query 2026, bahkan jika konten masih akurat.

Praktis: untuk halaman pricing dan halaman yang sering Anda update, pastikan lastUpdated schema benar-benar mencerminkan tanggal update terakhir. Untuk halaman evergreen, audit setiap 6 bulan dan update minimal 1 fakta agar tanggalnya refresh dengan alasan.

Yang masih tidak diketahui

Saya tidak punya akses ke logs internal Google, jadi semua di atas adalah pengamatan dari output, bukan eksplanasi sebab. Hal yang masih tidak jelas:

Apakah model menggunakan domain authority sebagai weighting di consideration set, atau hanya untuk filtering awal di ranking organik?
Berapa lama “window” antara konten yang dipublish dan jadi candidate di Overview? Pengalaman saya: 7-14 hari, tetapi bisa lebih cepat untuk topik yang sedang trending.
Mengapa beberapa Overview punya 1 sitasi dan beberapa punya 5? Apakah ini karakteristik query atau availability sumber yang qualified?

Eksperimen ini berlanjut. Saya akan update halaman ini ketika ada data baru yang meaningful.

Terakhir diupdate: 22 Mei 2026. Metodologi: observasi 12 query selama April 2026, lokasi tracking: Tangerang Selatan (GPS Tangsel), browser: Chrome incognito, signed-out account.

Lagi di SEO/GEO

№ 01

SEO/GEO

AI Overviews bukan magic — ini RAG dengan citation layer

2026-05-22 · 8 menit

№ 02

SEO/GEO

Checklist 7 fakta yang harus ada di setiap halaman layanan agar dikutip Overview

2026-05-15 · 7 menit

№ 03

SEO/GEO

Kenapa Local SEO di Tangerang Kota beda dengan di BSD — dan kenapa praktisi harus tahu

2026-05-12 · 8 menit

← Journal Arsip