Använda Google Data Mine

Anonim

Har du "googled" idag? Räckte du denna sida med "googling"?

Om så har du sett framtiden, och du är en del av det, även om du inte inser det ännu. Faktum är att det går mycket mer på Google än att bara söka. Jag ska prata om vad Google gör, vet - liksom vad du ska göra och veta för att få ut det mesta.

$config[code] not found

Sannerligen är Google mest känt för sin kraftfulla sökmotor, som bygger på en omfattande databas med webbsidor, videor, bilder, aktiekurser, telefonnummer, adresser och andra bitar av media och data för att ge relevant information - allt i den tid det tar att slå en nyckel.

Namnet på världens största sökmotor har blivit synonymt med att söka på Internet. Det har till och med blivit ett verb i vårt vardagsspråk (även om Google inte gillar oss att använda det på så sätt): vi "google" bilrecensioner, vår barndomsvänns nuvarande adress och, i flygningar av fantasi och storhet, oss själva.

Det är lätt att glömma att vi inte är ensamma när vi söker. Allt vi gör inom Google-miljön (och vissa saker vi gör utanför det) spelas in, lagras och analyseras. När du väl vet att ett företag har så mycket data tillgänglig, tar det inte lång tid att inse att all denna information kan användas för mycket mer än bara en trevlig sökupplevelse.

För att fullt ut förstå Googles potentiella kraft, luta dig tillbaka ett ögonblick och överväga hur Google fungerar lite mer detaljerat. Hur Google fungerar

Till den lediga sökaren är det inte direkt uppenbart hur Google söker så snabbt och med så bra resultat på Internet. Hemligheten är att när du skriver in en fråga söker de inte alls på Internet. I stället söker Google en databas som ständigt växer och uppdateras, 24 timmar om dygnet, 7 dagar i veckan.

Allt detta händer utan någon mänsklig intervention. Små program som heter "spindlar" eller "sökrobotar" följer självständigt länkar från en sida till en annan, hur en spindel följer trådarna på webben. När spindlarna kryper igenom webbsidor samlar de information om varje mening, bild, telefonnummer och allt annat de kan stöta på. De skannar varje sida de besöker, indexerar sökord och antecknings länkar till och från sidan. Då lagras denna information i en massiv databas. Samma länkar och sidor genomsökas om och om igen, vilket gör att informationen för Google förblir aktuell.

Google rankar sidor med informationen som spindlarna samlar in. Ingår i denna rankingsprocess är följande:

  • sökordsfrekvens och plats (fler nyckelord på mer framträdande platser är bättre);
  • Sidans ålder (ju mer etablerad sidan är desto bättre);
  • Antalet sidor som länkar till en sida (ju fler länkar det bättre).

Det finns andra faktorer som Google anser också, men de hålls hemliga för att hindra dem som skulle försöka spela systemet och göra höga poäng utan att verkligen ge användbar information. Dessutom, om du överdriver det och helt enkelt fyller din sida med överflödig information, listor med sökord och skräp länkar, kommer Google att straffa dig eller kanske till och med släppa din webbplats från databasen. Det är uppenbart att en fin balans måste träffas. Denna balans av faktorer på sidan är lika mycket konst som vetenskapen.

Ju bättre en sida poäng enligt dessa kriterier, desto högre rankas i sökresultaten. De högst rankade sidorna visas på första sidan i en Google-sökning. Eftersom de flesta Google-användare aldrig vågar förbi den första sidan, får de högt rankade sidorna en oproportionerlig mängd Internettrafik.

Allt detta för att säga att när du kör en sökning på Google kan den reagera så snabbt eftersom det inte försöker söka på hela Internetet just nu. Det konsulterar sin högorganiserade och prioriterade databas. Men ännu viktigare än att skapa blixtsnabba sökningar betyder att Google har ett enormt datalag om vad som finns på Internet och, viktigare, vem som använder vad, när och för vilket ändamål.

Vad vet Google?

Google "vet" mycket, faktiskt. Google håller reda på sökningar och håller även en fil på dina specifika sökningar baserat på din IP-adress eller Google-inloggning. Det ger dem ett litet fönster i ditt sinne och avslöjar vad som intresserar dig, oroar dig, exciterar dig och skrämmer dig. Detta är enbart kraftfull marknadsföring information.

Om du skulle kunna utnyttja den databasen skulle du kunna konstruera detaljerade profiler om individer - deras intressen, köpvanor, hälsofrågor, familjefrågor och mycket mer. Du kan upptäcka tecken som tyder på om ett företag lyckas eller misslyckas, oavsett om det överväger en fusion eller ett förvärv och vilka produktlinjer det kan expandera till. Du kan spåra historiska trender inom val, ekonomi, hälsovård och alla andra områden som har betydande sociala, ekonomiska och politiska värden.

Om du, medvetet eller utan tvekan, använder andra Google-tjänster, ger du ytterligare information. De skannar Gmail, får samma information från din korrespondens som dina sökningar, liksom vem dina vänner och samarbetare är. Om du delar dokument via Google docs, vet de vem du jobbar med och på vilka projekt. Google Checkout lägger till data om dina inköpsmönster, dina utgifter och dina budgetar.

Det finns också information som du skickar till Google utan att ens vara medveten om att du gör det. Google samlar, liksom andra Internet-tjänster, din IP-adress och eventuellt din MAC-adress. Din IP-adress berättar dem ungefär var du är i världen geografiskt, och din MAC-adress är en signatur som är unik för din maskin. Detta låter dem spåra om du alltid använder samma maskin, hur många maskiner du använder, och så vidare. Så, inte bara Google vet vad du söker och vem du kommunicerar med, företaget vet också vart du är och vilken maskin eller maskin du använder.

Låt oss ta ett steg tillbaka och erkänna att nästan vilken webbplats som helst har tillgång till viss eller all denna information. Till exempel samlas IP-adresser regelbundet för att försvara sig mot hackare och avslag på serviceattacker. Information om var du går på någons webbplats, när du anländer och lämnar, och var du kommer ifrån och går till, är all standard webbstatistik tillgänglig för även den minsta personliga webbplatsen.

Det som gör Google annorlunda är sin stora storlek och mångfald av tjänster, vilket gör det möjligt att samla in en större mängd information från många fler personer.

När din stash of information går från hundratals data till miljarder, har du insikt om att ingen annan gör det. Det som gör Google riktigt kraftfullt är att det kan observera människor i mer sammanhang än någon annan. Google tittar på dig även när du inte är på datorn. Google Maps ger högupplösta bilder av de flesta USA, liksom några andra områden i världen. Det är troligt att ditt hem kan ses på Google Maps, och om du råkar vattna på gården när satelliten flög förbi, kan du också se dig själv i ditt skarpaste kortbyxa!

Vad Google kan göra

Det finns några ganska uppenbara användningsområden för Googles databas, AdWords är kanske den mest populära och synliga i nuläget.

Varje gång du kör en sökning på Google, är de första listorna högst upp på sidan och listorna på höger sida "sponsrade länkar" betalade annonser som köpts av personer som tror att sökare som kör en sökning som din skulle vara intresserade av sina varor och tjänster. Denna teknik har spridits till andra webbsidor, vilket förklarar "Ads by Google" -moniker som du ser att leverera relevanta annonser för sidorna på andra webbplatser.

Det är klart att sälja detta annonsutrymme är en utmärkt inkomstkälla för Google. År 2007 tog AdWords Google över 16 miljarder dollar i intäkter, vilket gör det till Googles största inkomstkälla hittills. I jämförelse är Google-datalagret en guldgruva som knappt har tappats.

Hittills har de Google-funktioner som vi sett sett fokuserat främst på att reagera på nuvarande marknadstrender. Människor blir intresserade av någonting - den nya versionen av X-Box, hitta en elektriker online, Super Bowl-memorabilia, etc. - och Google är placerat för att hjälpa människor att ansluta sig till sina potentiella kunder.

Men med tillräckligt med information kan ett företag som Google göra mer än att bara reagera på nutiden med blixtens hastighet. Det kan också se framtiden, eller till och med skapa framtiden. Innan du tror att detta bara är en paranoid science-fiction dagdröm, ge problemet en viss övervägande.

Låt oss ta ett enkelt fall. Anta att du skapar ett program för att notera sökningar som misslyckas med att visa upp högklassiga sidofelade sökningar som inte ger någon väldigt användbar information till sökaren. Programmet som spårar dessa fel noterar vad sökaren ville ha och sätter de misslyckade sökningarna i kategorier.

Titta igenom dessa tal, vad händer om Google märker att det finns ett stort antal misslyckade sökningar som alla har att göra med att hitta en självhäftad superstore i Thermopolis, WY. Lite mer om, och jag har en lista över platser där det finns många misslyckade DIY superstore locator sökningar. Den listan skulle vara otroligt värdefull för ett företag som franchiserar DIY-butiker (inte namngivna några namn, men tänk på de stora apelsinlager i varje förort: skulle de inte vilja veta?).

De skulle inte bara veta att det inte fanns någon DIY butik där, men att ett visst antal personer letade efter en sådan butik. Och de skulle noga ha en aning om vad de hoppades köpa där: apparater, byggmaterial, gasgrillar, etc. Det här är smärtfri marknadsundersökning, snyggt sorterad och analyserad av Google automatiskt.

På samma sätt kan denna information användas för att identifiera potentiella köpare för en viss produkt, spåra brottslingar som bedriver barnpornografi och fånga potentiella tjuvar som höljer ett hem eller en butik. Det kan hjälpa utvecklare att välja webbplatser för nya bostäder och butiker, varna dig för allvarligt väder i ditt område, hitta registrerade väljare och lära sig om deras vanor och intressen, och hjälpa IRS hitta personer som fuskar på sina skatter. Det kan också finnas misstag av tolkning: En massa sökningar om cancer från en liten stad kan betyda många cancerpatienter, men det kan lika bra betyda att det finns en läkarskola där.

Som du kan se kan vi applådera några av användningarna av denna information och avkalla andra. Men de är alla möjliga, och alla använder samma grundläggande tekniker. Du kan hitta nästan vad du vill, du måste bara veta hur man letar efter den.

I min nästa artikel kommer vi att ta en titt på vad allt detta betyder för dig som individ … och som entreprenör. Hoppa till: Google Data Mine och ditt företag.

* * * * *

Om författaren: Hamlet Batista är VD för NEMedia S.A, en leverantör av SEO-automationsprogramvara som hjälper entreprenörer och småföretag att öka kvaliteten på sin naturliga söktrafik samtidigt som de fokuserar på vad de bäst gör. Hamlets blogg, Hamlet Batista dot Com, utforskar den mest avancerade SEO-forskningen, liksom strategier och taktik som kan ge dig en viktig fördel gentemot dina konkurrenter.

17 Kommentarer ▼