[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [OT] Spass mit Google?!?


Hallo Hans-Hermann,

On Wed, Jan 03, 2007 at 12:14:17AM +0100, HH Schafft wrote:
> hallo
> 
> zuerst mal allen die hier mitlesen ein gutes und erfolgreiches 2007 mit 
> vielen schoenen Tuxies und Beasties
> 
> Und jetzt meine Frage an Raphael :
> wie sieht es denn aus mit den anderen Suchmaschinen ?
> gibt es da auch schon eine Auswertung ?

Folgende Spider haben wir im Wiki-Log:

65754 "htdig/3.1.6 (admin_at_uugrn.org)"
38746 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.go***REMOVE***ogle.com/bot.html)"
19293 "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.ya***REMOVE***hoo.com/help/us/ysearch/slurp)"
2642 "sogou spider"
 903 "MJ12bot/v1.0.8 (http://majestic12.co***REMOVE***.uk/bot.php?+)"
 741 "msnbot/1.0 (+http://search.m***REMOVE**sn.com/msnbot.htm)"
 663 "msnbot-media/1.0 (+http://search.m***REMOVE**sn.com/msnbot.htm)"
 519 "Seekbot/1.0 (http://www.see***REMOVE***kbot.net/bot.html) HTTPFetcher/2.2"
 512 "Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://about.ask***REMOVE*.com/en/docs/about/webmasters.shtml)"
 208 "NewsFire/66"
 156 "Mozilla/4.0 (compatible; DepSpid/5.03; +http://about.dep***REMOVE***spid.net)"

Man sieht eine deutliche Dominanz von google und yahoo, laesst man mal
unseren eigenen Spider aussen vor. Mir ist nicht klar ob/woher altavista
sein Wissen ueber UUGRN bezieht, d.h. ueber welchen Bot die suchen. Wer
weiss das?

Die intensiven Zugriffe von google und yahoo erklaere ich mir dadurch,
dass die praktisch "real-time" das indizieren, was sich bei uns bewegt,
da sie regelmaessig die RSS-Feeds pollen.

MSN will sich mit Google messen. Zu mindest mit unserem Themenbereich
sind wir damit aber nicht besonders gut vertreten. Ich kann damit leben ;)

Mit der Mailingliste (lists.uugrn.org), sehr viel statischer Content 
seit einigen Jahren, sieht das Bild etwas anders aus:

51554 "Mozilla/4.0 (compatible; MSIE 5.0; Windows 95) VoilaBot BETA 1.2 (http://www.voi***REMOVE***la.com/)"
30548 "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.ya***REMOVE***hoo.com/help/us/ysearch/slurp)"
22509 "msnbot/1.0 (+http://search.m***REMOVE***sn.com/msnbot.htm)"
14565 "Mozilla/2.0 (compatible; Ask Jeeves/Teoma; +http://about.a***REMOVE***sk.com/en/docs/about/webmasters.shtml)"
14152 "Microsoft URL Control - 6.00.8862"
6844 "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.goo***REMOVE***gle.com/bot.html)"
5009 "e-SocietyRobot(http://www.ya***REMOVE***ma.info.waseda.ac.jp/~yamana/es/)"
4277 "htdig/3.1.6 (admin_at_uugrn.org)"
4089 "msnbot-media/1.0 (+http://search.m***REMOVE***sn.com/msnbot.htm)"
 736 "ia_archiver"
 733 "psbot/0.1 (+http://www.pic***REMOVE***search.com/bot.html)"
 409 "Mozilla/4.0 (compatible; DepSpid/5.03; +http://about.dep***REMOVE***spid.net)"

Auch hier sieht man keine Zugriffe von z.B. Altavista-Spidern. Woher
beziehen die ihre Daten? Unter welchem Namen sieht man deren Spieder?
Wenn/wo crawlt web.de? Unter welcher UA-Kennung? wiki.uugrn.org ist mit
Stand 29.12.2006 dort gelistet, ich habe keinen Zugriff gesehen.

Oder kaufen die einfach nur Daten bei yahoo oder google ein?

Denn sie haben alle Content, wie man bspw. bei der Suche nach UUGRN auf
www.metager.de sehen kann. Haben die ihre Spider alle mit
08/15-IE6-Kennungen laufen? 

Wenn irgendwann alle ihre Daten bei google einkaufen .... 

Gruss
Raphael 

-- 
Raphael Becker                                    http://rabe.uugrn.org/
                      http://schnitzelmitkartoffelsalat.und.rahmspin.at/
.........|.........|.........|.........|.........|.........|.........|..



-- 
http://mailman.uugrn.org/mailman/listinfo/uugrn