k-märkt

Google Blogsearch

Postat: 2005-09-15 kl. 18.16

OK. Så Google har nu lanserat sitt bloggsök och världen gör ännu en våg för Googles nya grej™:

Google Blogsearch, som är i beta, söker av bloggar med rss- eller atom-flöde som utnyttjar pingtjänster. En pingtjänst är en sajt som visar när anmälda bloggar har uppdaterat sin blogg.

- Vi söker av i realtid så att resultatet är så färskt som möjligt, säger Jason Goldman, produktchef för Google Blogsearch till Search Engine Watch.

Internetworld Google lanserar bloggsök i realtid (2005-09-15)

Nja. Internetworld har nästan förstått vad det går ut på, men inte riktigt. De indexerar alla bloggar som har ett flöde. De hittar bloggar med flöden till exempel genom pingtjänster som weblogs.com:

  1. Which blogs are included in Blog Search? The goal of Blog Search is to include every blog that publishes a site feed (either RSS or Atom). It is not restricted to Blogger blogs, or blogs from any other service.
  2. How do I get my blog listed? If your blog publishes a site feed in any format and automatically pings an updating service (such as Weblogs.com), we should be able to find and list it. Also, we will soon be providing a form that you can use to manually add your blog to our index, in case we haven't picked it up automatically. Stay tuned for more information on this.
Google Google Blog Search Help (2005-09)

Problemet med det är att de då får med alla sajter med rss-flöden, vilket inte minst märks om man gör sökningar på svenska och får upp alla IDG-tidningar, SR, Ny Teknik och så vidare. I USA verkar de filtrerat bort många av de stora manuellt:

(Of course, lots of sites that aren’t technically blogs offer feeds. CNN offers a feed; so does The New York Times. These sites aren’t blogs, but they are blog-like in the way they provide timely content. Apparently Google isn’t making these sites a part of the blog index. So there’s obviously some human guidance going on in the background, probably like the human guidance that drives Google News. We can only hope that the blog index isn’t plagued by the sorts of problems that plague Google News.)

Men jag menar fortfarande att det är galet att göra en bloggflik i Google. Visst är det bra att de tar med aktivt innehåll och därmed får ett mer uppdaterat index. Men varför inte integrera det med det vanliga indexet och nå bara bloggar via parametrar istället?

Technorati kommenterar:

This will mark a major milestone for the World Live Web. At Technorati, we have a tremendous amount of respect for the Google team and for everything they've done in the world of search. I'm sure that they'll continue to improve over the coming months, perhaps including tags, recent images and links, zeitgeists, blogger tools, and other types of semistructured data. I'm sure that they'll also start indexing the full-text of blog posts, not just the partial text found in most blog feeds.

Technorati Welcome to the Blogosphere, Google (2005-09-14)

Technorati är de som har mest att förlora på att andra aktörer går in på den här nischen av sök. Men det Technorati har på sin sida är fokus på bloggosfären. (Det de har på minussidan är sig själva och sin prestanda.) Men jag betvivlar att jag kommer använda Google Blogsearch. Precis som jag inte använder Technorati:s. Poängen är: Varför skulle jag bara vilja hitta bloggar? Jag vill hitta innehåll, inte bloggar. Bloggar har oftare bra innehåll, därför gillar jag ofta bloggar. Men jag gillar inte bloggar för att de är bloggar. Det är lika dumt som att fortsätta läsa tidningar för att de just är tidningar.

Det Technorati istället har är etiketter. Samma inlägg från The Shape of Days sågar etiketter:

Technorati’s response to Google’s blog search is pretty weak: tags. The idea behind tags is as simple as it is wrong-headed. Bloggers are supposed to assign descriptive metadata to their posts in order to tell indexing systems what their posts relate to. There’s just one problem with that: It’s a stupid idea.

Metadata in and of itself is not a stupid idea. In fact, it’s pretty darned important for things like digital music. If every one of the 14,000-odd tracks in my iTunes library didn’t have a full complement of metadata (titles, artists’ names, years of publication, that kind of thing), I’d never be able to find anything. My vast music library would be useless. So metadata in and of itself is a pretty clever idea.

But explicit metadata sucks. Metadata you have to key in yourself sucks. I own about a thousand CDs, the vast majority of which are in the top of my upstairs closet or sitting in the attic. If, when I decided to move them into iTunes a couple of years ago, I’d had to manually key in all the metadata for each of those thousand CDs, it would have driven me to distraction. In fact, it probably wouldn’t have been worth it at all. I either would have had a bunch of tracks in iTunes with incomplete metadata, or I would have given up and not bothered to convert my music library at all.

Men jag skulle använda samma exempel för att visa på styrkan. Genre-funktionen i iTunes är precis sådär dum som bara statiska kategorier kan vara. Alternative säger mig ingenting när jag vill hitta till musik. Det kanske inte en specifik etikett skulle göra heller, men dess relation till andra skulle kunna göra det. Styrkan med etiketter är relationen till andra etiketter samt att de fungerar som tvärbalkar över olika områden. Xiu Xiu är punk, men låter knappast punk. Jag behöver hitta det via något annat. Skör till exempel. Eller blod.

En annan grej som jag är lite förvånad över att de inte gör är zeitgeist-funktioner som Technorati:s Popular eller knuff.se.

Knyta ihop säcken med smarta kommentarer på slutet? Aldrig!

Permalänk

Kategori: Internet

Bakåtspårning (Trackback)

Bakåtspårnings-URL för det här inlägget:
http://k.digitalfarmers.com/mt/mt-tb.cgi/752

Kommentarer

En viktig distinktion som man bör göra kring etiketter är om de definieras av publicisten eller användaren. De förra har samma problem som meta keywords haft sen webbens barndom.

Kommenterat av: Henrik Torstensson den 2005-09-17 kl. 17.53 #

Kommentera


(visas aldrig på sajten men måste anges)


Kom ihåg mig?

(du får använda html-kod)