lunedì 10 luglio 2006

[Adwords] Testare ADS geo-localizzate

Ho scoperto solo oggi (leggendo il Blog ufficiale del gruppo Adwords di Google) l’esistenza di una pagina di test per verificare l’uscita dei “propri ADS” geolocalizzati:

http://www.google.com/adpreview

Infatti agendo manualmente sulla URL è possibile simulare la visualizzazione delle SERP di google e quindi della relativa uscita degli ads di adwords “da qualunque parte del mondo” :

per lingua usata dagli utenti, stato, regione e città , attraverso il codice postale … fino alle coordinate geografiche di latidune e longitudine !

la segnalazione sul Forum GT

Web Server & influenze sulla "SEO"

Configurazione del dominio, server web e scelta del provider dovrebbero essere attività da valutare con attenzione anche in chiave SEO: ecco un promemoria di possibili verifiche da fare prima di scegliere il proprio spazio Hosting (o in caso di incomprese penalizzazioni):

1) "autorevolezza" del proprio dominio:

Un elemento che potrebbe differenziare un buon sito da un cattivo sito (agli occhi di un "motore ideale")è la storia e il tipo di dominio che si utilizza o che ci si appresta a ottimizzare, ecco alcuni possibili elementi da considerare:

- Quando scade? Piu' lunga la durata della registrazione e piu' lontana la data di scadenza (un dominio si puo' registrare anno per annoma anche per piu' anni) piu' è sintomo di un dominio a cui "si tiene", "importante".

- La storia del dominio:Quanto è vecchio? Un dominio anziano è un dominio migliore. I nuovi domini sembrano passare infatti per verifiche e considerazioni che alcuni motori(google) non riservano per tutti gli altri creando tal volta effetti penalizzanti (Sandbox) che si risolvono solo col tempo (perora cosi sembra...)
Dopo la conseguente nascita del mercato del dominio usato (soprattutto da parte di spammatori e spam engines) si puo' immaginare che nuovi criteri venganoconsiderati per decidere "autorevolezza" e importanza di un dominio:
Quanti proprietari ha avuto? quali sono stati gli argomenti trattati dalle sue pagine web? Anche in questo caso,si puo' immaginare che "un motore ideale" giudicherà meglio i domini mono-proprietario, che hanno cambiato meno servers, admin c o tecnhical contact,e i cui corrispondenti temi e argomenti sulle pagine web che ha ospitato ospita siano rimasti gli stessi

- IP dedicato o IP condiviso ?Un sito hostato insieme ad altri mille vale senza dubbio meno di un sito da solo su un bel server dedicato (sempre agli occhi del ns"motore ideale") ecco perchè si "rumoreggia" che investire di piu' nella gestione del proprio dominio possa dare dei vantaggi.Inoltre se al ns stesso indirizzo IP sono presenti numerosi siti bannati, spam engine e compagnia bella, io, al posto del "motore ideale" potrei anche pensare di bannare (o almeno penalizzare) l'intero IP per "togliermi il pensiero"!

Strumenti e tools:
Info sui domini: nic.it whois.eu dnsstuff.com (whois lookup) e molti altri...Storia di un sito: archive.org verifica IP : domaintools.com/reverse-ip/ o dnsstuff.comCon chi è condiviso il mio sever?: per ora chiedete al provider !(non mi ricordo dove avevo visto un tool per cercare siti su di un server...)

2) Verificare la configurazione del dominio:

E' importante che il provider abbia configurato bene il dominio sui propri server in modo da non creare difficoltà di sorta al lavorodegli spider....

- www e senza wwwProvare a cercare la propria pagina con www. o senza www. : deve funzionare per entrambi (vogliamo forse perdere qualche bl?)

- Configurazione header Http:Cercando una pagina inesistente ho un messaggio di errore 404 "not found"? se si tutto ok.

- Verificare la configurazione del DNS (sono davvero sempre raggiungibile da tutti? Ho un server di qualità? in che tempi risponde il mio server?)Qui sono necessari alcuni strumenti di verifica DNS:

kloth.net/services/nslookup.php DNS report, DNS Timing (tempo risposta) : dnsreport.com/ Reverse DNS, trasversal DNS: dnsstuff.com

3)Sulla reputazione del provider cosa si puo' sapere?

Come è considerato il ns provider dal "motore ideale" che verifica anche l'appartenenza del mio sito a questo o quelprovider e che probabilmente considererà le mie pagine in maniera diversa a seconda della sua "fama"?

- Reputazione: google search (web + NG)- Blacklist: vedi sopra, domaintools ti dice se un IP è blacklistato e dove - http://www.dnsstuff.com/tools/ip4r.ch?ip=xxx.xxx.xx.xx

P.s Già che ci siamo sarebbe anche meglio se il ns provider ci consentisse di:
Possibilità di creare redirect lato server (301) Supporto dell'intestazione If-Modified-Since Pagine di errore personalizzabili Possibilità di creare sottodomini (magari gratuitamente) Accesso ai file di log del server Possibilità di assegnare un IP dedicato al dominio

mercoledì 10 maggio 2006

Promuovere un Blog

ATTENZIONE!L'articolo che stai leggendo è stato scritto piu' di un anno fa. Le informazioni presenti potrebbero non essere aggiornate!
-------------------------------------------------------------------------------------------------------------------------------------------------------------------

I fattori esterni di una buona promozione di un Blog, differiscono leggermente dalle attività necessarie alla promozione di un sito web anche se nella sostanza non cambiano i principi fondamentali (ovviamente sempre parlando in funzione delle tecniche di promozione sui motori di ricerca e non di marketing in senso generale).

Anzi forse ancor piu' per i Blog la parola chiave è "popolarità".

Dopo aver pubblicato il proprio BLOG, diverse e piu' specifiche sono le attività da fare ai fini della sua promozione in rete...

Senza dimenticare che anche per questo tipo di sito web restano validi i concetti legati ai "fattori interni" , quali l' url-rewrite (fondamentale!), l'attenzione alla qualità e alla quantità dei contenuti oltre che alla periodicità di aggiornamento, o fattori favorevoli come la pubblicazione automatizzata di una Google Sitemap, il concetto invece di popolarità e autorevolezza di un BLOG assume differenti sfumature :

Piu' che per qualunque altra tipologia di sito web o portale, per i Blog è fondamentale essere presenti su directory e motori specializzati. Non solo per una questione di BL, ma soprattutto per una questione "reale" di visite e per la peculiarità di diffusione del fenomeno.

Le ricerche di articoli e pubblicazioni di Blog, avvengono infatti nella maggioranza dei casi attraverso canali specializzati, i quali indicizzano solo BLOG catalogandoli per TAG (argomenti) , mostrando i risultati in funzione soprattutto della attualità delle pubblicazioni e favorendo in questo modo moltissimo il feeling da parte degli utenti e la ricerca di FEED RSS (l'unico modo per poter seguire agevolmente piu' Blog contemporaneamente!) di argomenti di proprio interesse.

Sarebbe bene poter specificare per ciascun Post che si scrive quali sono i "TAG" (o comunque le keyword o gli argomenti )che lo identificano. Cio' faciliterà notevolmente la loro visibilità sulle varie directory. Non tutte le piattaforme sono dotate di questa funzionalità, quindi è utile cercarne immediatamente uno che faccia al caso nostro. (ecco un esempio di plugin per wordpress)

Una lista molto completa ed aggiornata la potete trovare su RSS-World uno dei siti di divulgazione piu' completi sull'argomento (scritto da "Weppos" mod di HTML.it). Un altra lista è disponibile qui. (grazie, Giorgio!)

Oltra ad inserire il proprio BLOG è importante usufruire dei servizi di "PING" dei propri contenuti, cioè sistemi manuali o automatici (molte piattaforme Blog ne sono forniti di default) che permettono la notifica dell'avvenuta pubblicazione di nuovi articoli o aggiornamenti (vi sono anche servizi esterni alla piattaforma, vedi Pingomatic, che permettano di fare segnalazioni multiple)

Un altro aspetto che ha una maggiore rilevanza per un Blog è la pratica dell' "outgoing Link" , o meglio della segnalazione di Blog esterni affini al proprio settore all'interno delle BlogRoll (liste di Blog, predisposte dalle varie piattaforme): è prassi comune fra i Blogger quello di ricambiare eventuali link ricevuti.

A tale scopo puo' essere vantaggioso usufruire di account e servizi particolari offerti su siti e directory specializzate come Feedburner o Tecnhorati in modo da trovare facilmente Blog inerenti il proprio settore o argomento di interesse, condividere e segnalare con altrettanta maggiore facilità i propri "preferiti" e infine diffondere maggiormante i propri Feed.

Un BLOG si caratterizza piu' autorevole ed è avvantaggiato nelle ricerche sulle directory di settore maggiori sono i link che riceve da altri BLOG, link che vengano registrati dai motori specializzati alla stregua dei BL, anche se ad oggi non mi pare che esista qualcosa di analogo al PR per qualificare maggiormante link da BLOG importanti.

Anche per questo motivo un BLOG dovrebbe favorire al massimo la propria diffusione facilitando gli utenti che lo visitano a memorizzarlo sui propri sistemi (preferiti, feed aggregator, social bookmarking) attraverso i tipici "pulsanti"

A maggior ragione si dovrebbe dare una buona visibilità ai propri FEED RSS.
Un altro fattore importante sono i Permalink, cioè la possibilità di associare un link a ciascun post, cosa che aiuta sia l'indicizzazione del Blog, sia la sua diffusione fra gli utenti.
Un altro strumento molto utile è il TrackBack, (normalmente incluso nelle diverse piattaforme o disponibile come servizio di terzi tipo Simpletracks, Haloscan e BlogItalia).

Lo strumento permette infatti di inserire link a propri post in articoli di altri Blog o forum... basterà infatti segnalare la url del articolo su cui vorremmo far apparire il nostro collegamento all'interno dell'area predisposta nel pannello di editing del ns Post, cio' creerà sia un link verso l'articolo cosi' "pingato" sia, a seguito dell'accettazione dell'autore, un "pingback" verso il nostro Blog.

Ultimo ma non ultimo, cercate di tenere vivo il vs BLOG, soprattutto di stimolare discussioni e molti commenti, questi ultimi infatti creano "outgoing link" naturali verso siti affini e tematizzati e mantengono aggiornato il Post.

lunedì 20 marzo 2006

L' Information Retrieval e il funzionamento dei Motori di Ricerca

ATTENZIONE!L'articolo che stai leggendo è stato scritto piu' di un anno fa. Le informazioni presenti potrebbero non essere aggiornate!
----------------------------------------------------------------------------------------------
Comprendere le basi del funzionamento dei motori di ricerca aiuta a vivere meglio... almeno in ambito SEO & SEM ;-)

Ecco allora un buon riassunto dei concetti "di base" :

Non si puo' parlare di motori di ricerca senza introdurre il concetto di "information retrieval" che altro non è che il nome che viene comunemente assegnato alla tecnologia alla base dell'interrogazione e della ricerca su archivi digitali.

"To retrieve" , in inglese "riportare" , "riportare indietro" rende bene il senso delle ricerche sui motori di ricerca: individuare fra miliardi di documenti archiviati quelli piu' adatti ad essere "ri-portati" agli utenti a seguito di precise interrogazioni.

Cosi' come non si puo' consultare una biblioteca senza un sistema di indicizzazione e catalogazione dei libri allo stesso modo non è pensabile di ricercare informazioni su Internet senza l'utilizzo di opportuni strumenti di information retrieval:

I motori di ricerca !

Inizialmente i "motori di ricerca" che parevano piu' idonei erano degli archivi di siti catalogati manualmente per argomenti , le cosiddette Directory, di cui Yahoo, siamo nel 1994 ne è il piu' famoso esempio.

Ma il numero di documenti, pagine, siti web sempre crescente (dell'ordine di miliardi) e l'enorme quotidiana mole di nuove pubblicazioni hanno fatto si che l'importanza delle Directory "umane" si affievolisse di fronte al nascere di algoritmi automatizzati di archiviazione, quali sono i MDR (motori di ricerca) propriamente detti.... il primo importante fu certamente Altavista, che è rimasto molto in auge fra gli utilizzatori della rete fino alla nascita di un certo Google (1998), che ha fatto delle innovative tecnologie di information retrieval il suo cavallo di battaglia!

Vediamo quindi di approfondire quali sono fondamentalmente i compiti e le caratteristiche principali di funzionamento di un MDR, la domanda è "Come funziona fondamentalmente un motore di ricerca?"
Approssimando l'attività di un motore di ricerca si distingue in piu' fasi fondamentali:

1. "Ricerca dei documenti da catalogare"

La prima cosa da fare per un motore di ricerca è quella di trovare tutti i documenti da catalogare: piu' ne troverà e maggiore sarà la completezza delle informazioni che potrà fornire ai propri utenti, quindi è compito di un MDR (motore di ricerca) di facilitare il recupero del maggior numero possibile di documenti ....


Agli albori della rete (bè pochi anni fa a dire il vero) uno degli strumenti principali per ottenere tale scopo era quello di richiedere agli autori di siti (documenti) di segnalare in appositi Form l'indirizzo (la URL) di ogni nuovo sito pubblicato. Il sistema è certamente ancora valido e utilizzato ma di sicuro non è piu' lo strumento principe affinchè un proprio sito venga catalogato dai motori di ricerca...


Infatti oggi tutti i MDR utilizzano sistemi informatici per la ricerca dei documenti da catalogare in rete: i cosiddetti SPIDER ! ("ragni", che camminano sulla rete/ragnatela). Uno spider è un software ( o meglio uno Bot, uno script automatico) che partendo da una lista di URL (indirizzi) di documenti/siti da catalogare "segue" ogni possibile LINK (collegamenti ad altri documenti) che trova, catalogando di ciascuno le informazioni presenti.

Quindi per far si che un ns documento venga catalogato da un MDR dobbiamo fare in modo di "ricevere una visita" da parte degli spider... basterà quindi che qualche altro sito già catalogato inserisca un LINK verso il ns oppure dovremo segnalare la URL direttamente al motore di ricerca.


2. "Indicizzazione"

La ricerca dei documenti in rete avviene continuamente in modo che il MDR possa avere in archivio sempre documenti il piu' possibile aggiornati ... ma come avviene la catalogazione delle pagine trovate?

Bè qui ogni motore utilizza una versione di Spider differente ed ognuno segue precise regole ma la cosa che sono tutti "costretti" a fare è archiviare ogni singolo documento in INDICI organizzati in modo che al momento delle richieste da parte degli utenti sia piu' facile e veloce ritrovare le migliori informazioni da fornire come risultato: ecco perchè questa fase viene chiamata INDICIZZAZIONE .

Quando si parla quindi di archiviazione o catalogazione di un documento su di un MDR il termine corretto è : "indicizzazione".

Piu' organizzato sarà l'indice piu' efficente saranno velocità e congruenza dei risultati forniti. Compito dell'indicizzazione e quindi degli indici dei documenti creati è quello di facilitare il ritrovamento del risultato piu' consono alla query di ricerca effettuata dall'utente: in linea generale viene creato un super-indice formato da tutte le parole trovate dallo spider nella rete ordinate alfabeticamente; a ciascuna parola (eliminate le cosiddette "stopword" cioè gli articoli, le congiunzioni ecc ecc) viene associato l'ID dei documenti che la contengono .

Quando un utente cercherà ad esempio, "albero" il MDR potrà andare velocemente (grazie all'ordinamento alfabetico) a cercare tutti i documenti prcedentemente indicizzati che contengono tale parola fornendo velocemente una lista di risultati.
In realtà motori come Google, distribuiscono su piu' server il compito di effettuare la ricerca: per ogni query lavorano oltre 500 server! ...in questo modo riescono a fornire risultati molto rapidamente.


3. "Ranking"

Ma il numero elevato di documenti rende necessario al MDR dover compire un ulteriore passo: non solo fornire tutti i documenti possibili che contengono una determinata query, ma gioco forza, fornirli ai propri utenti con un ordine di importanza prestabilita: prima i documenti che meglio rispondono alla ricerca poi gli altri...

Ma come viene calcolato il Ranking (l'importanza) di un documento all'interno di tutti i risultati possibili? Come vengono ordinate le SERP (Search Engines Results Pages) , cioè i risultati dei motori di ricerca?

Siamo arrivati velocemente al punto nodale dell'argomento : come ottenere un miglior posizionamento di un proprio sito/documento sui motori di ricerca:

Tecnicamente per ogni query (ricerca) di un utente l'algoritmo del MDR assegna o meglio calcola "un punteggio" ad ogni documento indicizzato e fornisce dei risultati in ordine di importanza: prima i documenti che hanno ottenuto un maggior punteggio poi tutti gli altri...

Il modo e i diversi elementi con cui ogni algoritmo (perchè ogni MDR ne ha uno proprio!) assegna un punteggio ad un documento NON è possibile conoscerlo (bè, neanche la formula della Coca-cola la conosce nessuno!) ma attraverso lo studio e la sperimentazione è possibile cercare di avvicinarsi a capire quali sono gli elementi piu' importanti:

Ogni Mdr ha la sua "formula" ogni MDR ha i suoi criteri... Comunque fondamentalmente i MDR assegnano "punteggi" su due livelli:

1. relativamente e puntualmente alla query fatta e quindi a "fattori interni" al documento relativi a posizione e corrispondenza all'interno del documento stesso delle parole cercate ( frequenza, distribuzione, posizione, ecc)

2. In funzione dell'importanza del "documento" a prescindere dalla query ... cioè in fase di indicizzazione ogni documento assume un "punteggio" in base a "fattori esterni " a fattori di carattere generale e non "puntuale" quali sono ad esempio il numero di Link che il documento riceve in rete e in pase alla qualità degli stessi. (vedi avanti "Page Rank" nel caso specifico di google)

Vediamo di fare un semplice esempio del funzionamento di quanto detto, immaginiamo una query qualunque:

"Motori di ricerca"

Ignorata la "di" perchè stopword, i server che contengono l'indicizzazione incroceranno tutti i documenti (indicati da un numero di id) che contengono le parole "motori" e "ricerca" ...


Motori id100 id201 id203 id444 ecc ecc ecc
Ricerca id100 id123 id245 id444 ecc ecc ecc

Tutte e due le parole presenti id100 id444


I documenti n° 100 e N° 444 sembrano i piu' idonei, un opportuno algoritmo provvederà a calcolare il "punteggio" da assegnare ai documenti, e prima di mostrarli nelle "serp" , il MDR andrà anche "a leggere" sui server dove i documenti fisicamente risiedono in copia e costruirà lo "snippet" cioè la frase del contesto che accompagna ogni risultato, per poi finalmente offrire i risultati all'utente!

Il tutto in qualche frazione di secondo! Ecco lo schema di funzionamento di Google :

1. Il web server invia la query al Datacenter :

2) Qui, sui dati "indicizzati" (vedi Phrase Rank) agiscono gli algoritmi che restituiscono la lista ordinata per importanza dei documenti che la contengono

3) Viene creato lo "snippet" grazie alle versioni di cache presenti sui "Documents server"



4)... "infine" i risultati vengono mostrati (il tutto in una frazione di secondo) all'utente!
Lo studio di questi meccanismi e soprattutto degli algoritmi che assegnano i "punteggi" ai documenti da mostrare in "serp" , e le relative contromosse possibili per cercare di migliorare il "ranking" di propri documenti, è cio' che viene definito: "Posizionamento sui motori di ricerca" !
Da qui in avanti cercheremo di analizzare puntualmente tutti i possibili elementi che contribuiscono a formare il Ranking delle serp sui Mdr.

Da segnalare sull'argomento:
Sul db di Google e sui sistemi di indicizzazione dei dati storici: Google Big table