ISBN.nu si perde e si ritrova in Google gaffe

La scorsa settimana pensavo di aver completato la mia serie su ISBN.nu, un servizio online di confronto dei prezzi dei libri che inserisce 135.000 delle sue pagine nell'indice di Google.com. Ma questo prima che il rapporto tra il servizio Web e Google diventasse una notizia dell'ultima ora.

Un giorno dopo che il mio numero del 21 febbraio ha rivelato che ISBN.nu memorizza meno di 4.000 pagine sul suo server - le altre 131.000 pagine vengono generate dinamicamente ogni volta che uno spider del motore di ricerca (o un essere umano) segue un collegamento - quasi tutto il le pagine del sito sono improvvisamente scomparse dall'indice di Google. Quando ho controllato il link (riprodotto sotto) che mostra il numero di pagine ISBN.nu che sono nell'indice di Google, il totale era sceso a soli nove.

Il webmaster di ISBN.nu Glenn Fleishman inizialmente pensava che un funzionario di livello inferiore di Google avesse sentito parlare della mia storia e decise di vietare il sito. Non andava bene con Fleishman. Dice di aver parlato personalmente con i massimi dirigenti di Google nel corso degli anni. Per come lo descrive, Google non ha problemi a indicizzare le pagine generate dinamicamente, a condizione che il contenuto visualizzato da uno spider sia esattamente lo stesso che vedrebbe un essere umano. Molti siti basati su database generano legittimamente pagine su richiesta piuttosto che archiviare ogni pagina immaginabile sul disco rigido di un server.

Fortunatamente, l'interruzione è stata causata da un errore in una routine software di Google. La società del motore di ricerca mi assicura che le pagine di ISBN.nu torneranno all'indice di Google entro pochi giorni, se non lo sono prima della lettura.

Il modo in cui Fleishman ha gestito il problema, tuttavia, ci offre un prezioso tutorial. Allo stesso tempo, l'interruzione rivela come funziona un algoritmo di "divieto" relativamente nuovo di Google. Ecco la storia:

1. COMUNICAZIONE APERTA. Quando Fleishman ha notato il 6 marzo che le sue pagine non erano presenti nell'indice di Google, ha inviato e-mail educate ma preoccupate ai suoi contatti del motore di ricerca, che aveva incontrato in precedenza.

2. RELAZIONI STAMPA. Fleishman mi ha informato del problema, dopodiché ho inviato una e-mail separata ai miei contatti di Google (sui quali avevo pagato per coincidenza una telefonata di cortesia all'inizio di febbraio) chiedendo chiarimenti.

3. ANALISI. Quando un portavoce di Google ha risposto che le pagine mancanti erano semplicemente causate da un problema tecnico, non da una decisione politica, Fleishman ha analizzato la situazione e ha scoperto che non erano necessarie modifiche nella progettazione del suo database.

Il problema? Ogni pagina di confronto dei prezzi su ISBN.nu include collegamenti a ben nove diverse librerie. Con 135.000 pagine indicizzate, si aggiungono molti link. E ogni collegamento contiene stringhe di codice di affiliazione essenziali in modo che ISBN.nu possa guadagnare una commissione se un utente finisce per acquistare un libro.

Come afferma Nate Tyler di Google, "Il problema sembra avere qualcosa a che fare con il gran numero di reindirizzamenti di affiliati, che hanno attivato parte della nostra tecnologia automatizzata". Ciò significa che una routine del software Google ha indovinato che ISBN.nu era una "link farm". Questo è un anello Web fasullo in cui centinaia di siti creano centinaia di collegamenti tra loro, cercando di ingannare il ben noto sistema di "popolarità dei collegamenti" di Google.

Fleishman riferisce che il blackout di Google ha causato un crollo a 5.000 visitatori al giorno da 9.000 (un calo del 45%) e un calo dal 30% al 40% delle sue entrate di affiliazione. Aggiunge che Yahoo ha recentemente omesso ISBN.nu per alcuni giorni, tagliando a un paio di migliaia di referral al mese da quella fonte. Ciò sottolinea l'importanza del traffico dei motori di ricerca verso alcuni siti di e-business, mentre altri fanno molto più affidamento sui propri sforzi pubblicitari e di marketing.

Se hai provato il mio collegamento il mese scorso al numero di pagine ISBN.nu su Google, mi scuso se non ha rivelato le 135.000 pagine che ho promesso. Puoi provare il link qui sotto per alcuni giorni per vedere quante pagine del sito tornano all'indice mentre lo spider di Google esegue nuovamente la scansione dei link.

COMMENTO DI GLENN FLEISHMAN SULL'INTERRUZIONE DI GOOGLE:

//[email protected]/?4e52

UNA RICERCA CHE MOSTRA IL NUMERO DI PAGINE ISBN.NU SU GOOGLE

//[email protected]/?61da

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

REVISIONE TECNOLOGICA DI E-BUSINESS: PRINGLE VUOTE POSSONO ANTENNA WIRELESS

Utilizzando una lattina di patatine Pringles vuota come antenna esterna, gli hacker malintenzionati possono facilmente trovare e penetrare in molte reti wireless aziendali, secondo un'analisi di I-sec, un gruppo di consulenza sulla sicurezza.

L'azienda ha guidato un'auto nel quartiere finanziario di Londra, utilizzando una lattina di Pringles vuota per amplificare i segnali della rete wireless. Più di due terzi delle aziende che utilizzano il wireless o Wi-Fi non avevano implementato alcuna funzionalità di crittografia, ha affermato il gruppo di sicurezza. Tali reti sono vulnerabili al furto di larghezza di banda o all'intrusione di dati.

Il contenitore tubolare Pringles costituisce un'efficace antenna direzionale, nota anche come antenna Yagi. I piani per utilizzare questo e altri dispositivi per identificare i segnali Wi-Fi hanno iniziato a circolare su Internet lo scorso anno.

BBC News Online afferma di aver visto I-sec rilevare quasi 60 reti wireless non protette in un unico viaggio di 30 minuti attraverso i canyon della città. Il suo rapporto descrive il problema e suggerisce soluzioni semplici.

I PRINGLE VUOTI POSSONO AIUTARE GLI HACKER A TROVARE WI-FI NON PROTETTI:

//[email protected]/?7562

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

LE 10 MIGLIORI NOVITÀ DELLA SETTIMANA DI LIVINGSTON

1. Netscape Navigator 6 legge le ricerche, dice Newsbytes

//[email protected]/?41a

2. Le miniature delle immagini online sono OK, le regole del tribunale

//[email protected]/?802

3. I siti di musica in streaming condannano i tassi di royalty arbitrati

//[email protected]/?bea

4. Come guadagna soldi il b-to-b di Miller Freeman sull'acquisto di carta

//[email protected]/?fd2

5. Offrire la spedizione gratuita oltre $ 99 aumenta la dimensione dell'ordine

//[email protected]/?13ba

6. La Corte Suprema può annullare l'estensione del copyright

//[email protected]/?17a2

7. Fantastico: come costruire una galleria rotante in ColdFusion

//[email protected]/?1b8a

8. La frode è 19 volte più probabile online che offline

//[email protected]/?1f72

9. Suggerimenti HTML: il modo giusto per rendere veloci i rollover

//[email protected]/?235a

10. Impedisci agli hacker di utilizzare PayPal per rubare i tuoi contenuti

//[email protected]/?2742

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

WACKY WEB WEEK: GENERATORE DI TABLOID POP BAND SPLIT-UP

Forse questo potrebbe soddisfare le esigenze di contenuto del tuo sito. Digita alcune parole chiave in un modulo Web e presto: Popjustice, un sito di musica indie irriverente, sputa un articolo scandalistico perfetto sull'imminente scioglimento di qualsiasi gruppo pop di tua scelta.

Un po 'taglia e incolla per copiare la voce dal suono familiare e anche tu puoi sembrare un insider musicale. Il sito con sede nel Regno Unito di Popjustice è una sorta di incrocio tra una fanzine e uno dei blog più elaborati che tu abbia mai visto. Provalo, ma fai attenzione: linguaggio cattivo e umorismo giovanile, ragazzi.

LO SPURIOSO MOTORE WEB A BANDA SPLIT DI POPJUSTICE:

//[email protected]/?c382

- - - - - - - - - - - - - - - - - - - - - - - - - - - -

SEGRETI DI E-BUSINESS: la nostra missione è fornirti informazioni così utili e stimolanti sul Web che non vedi l'ora di leggere la tua posta elettronica.

INFORMAZIONI SULL'AUTORE: E-Business Secrets è stato scritto da Contributing

Editore Brian Livingston (//SecretsPro.com). Il direttore della ricerca è Ben Livingston (nessun parente). Brian ha pubblicato 10 libri, tra cui:

Segreti di Windows Me:

//[email protected]/?0764534939

Segreti di Windows 2000:

//[email protected]/?0764534130

Vinci un buono regalo valido per un libro, un CD o un DVD di tua scelta se sei il primo a inviare un suggerimento che Brian stampa. mailto: [email protected]