≈ Relations

Random Rants and Ramblings about Media and/or Technology

Archive for the ‘Noteworthy’ Category

Going places – Status and example

one comment

D-Ticker Scrennshot

Ed. note.: Another autumn-cleaning action. This time the post has been sitting here in a draft state since at least 15 months. Time to get it out of the door.

It’s part of a  mini series called “Going places” about geocoding news at the source. Prior installments of this series can be found here. They for example explain what places of news, places within news and scopes are.

Current status of geocoded news  at dpa-infocom

Since approx.  15months we are  geocoding both places of news and places within news in our regional online wires. Right now we are geocoding:

  • scopes as places of news and
  • (generalized) addresses as places within news.

Representing geocodes within NITF

Being a news agency, IPTF formats are more or less the de facto standard of delivering news to our customers :-( Being the unline and mobile subsidiary we are delivering our wires as NITF. Hence we had to find a way to fit this information into this format.

In order to minimize the hassle for us as well as our customers we had to stay within the bounds of the NITF format as much as possible.

Since in the news industry the main delivery model is still push delivery (mostly via FTP :-( ) , there is also a need to include as much information about the scopes of news as possibe. Offering only a pointer (e.g. to a Restful API) that allows to access additional information would only be used by our most advanced customers :-( .

Hence we chose to use the language constructs for describing locations already provided in that format as much as possible and only resort to other means when there was no means for describing this information at all.

The NITF format (see NITF Documentation) provides at least two ways of representing location information:

  • evloc : Event location. Where an event took place (as opposed to where the story was written).
  • location : Significant place mentioned in an article. Used to normalize locations.

The first question to ask is why there are two different tags for geocoding locations (i suspect the standardisation process being responsible for that). Looking at the DTD definitions for both evloc and location, one can notice that they both try to describe the same information, but the location tag is actually the better and more detailed way of doing so.

Since we already used the evloc tag for denoting the country where the event primarily took place (i.e. some inverse locus like information ) we had every reason to only use the location tag for the locations of the news as well as the location in the news.

One might also note by looking at the DTD that apparently the NITF standardisation body didn’t consider the scope of the news to be a location and didn’t include any means to include any actual geographic data (e.g. points, lines, polygons, …).

But luckily an arbitrary number of locations can be included via the location tag, unfortunately only allowed in the head section of the document. The DTD of NITF then allows an arbitrary number of country, state, region, city and sublocation tags.

In order to be able to unambiguously represent the hierarchy we restricted this to a single occurence of the tags country, state, region and city as well as up to two sublocation tags.

Before going into detail, below is an example of a news story that has both: scopes and addresses. I guess it is the best way to explain our approach and to describe some of the problems we had / have to navigate. Location relevant part highlighted).

Example

<?xml version="1.0" encoding="UTF-8"?>
<!-- DOCTYPE nitf PUBLIC "-//IPTC-NAA//DTD NITF-XML 3.0//EN" "nitf.dtd" -->
<nitf xmlns:georss="http://www.georss.org/georss">
<head>
<title>Bayern München II schlägt Karlsruhe 3:1</title>
...
<identified-content>
<location class="scope">
<region region-code="09184000" code-source="AGS">München
	<georss:point>11.5725580365 48.1379548096</georss:point>
</region>
<state state-code="09000000" code-source="AGS">Bayern
	<georss:point>11.5725580365 48.1379548096</georss:point>
</state>
<country iso-cc="DEU">Deutschland</country>
</location>
<location class="scope">
<city city-code="09162000" code-source="AGS">München
	<georss:point>11.5725580365 48.1379548096</georss:point>
</city>
<state state-code="09000000" code-source="AGS">Bayern
	<georss:point>11.5725580365 48.1379548096</georss:point>
</state>
<country iso-cc="DEU">Deutschland</country>
</location>
<location class="scope">
<city city-code="08212000" code-source="AGS">Karlsruhe
	<georss:point>8.40437796821 49.0092142029</georss:point>
</city>
<state state-code="08000000" code-source="AGS">Baden-Württemberg
	<georss:point>9.17871582656 48.7750805322</georss:point>
</state>
<country iso-cc="DEU">Deutschland</country>
</location>
<location class="address">
Grünwalder Stadion, Grünwalder Straße, München, Germany
	<georss:point>11.566936 48.101078</georss:point>
<city>München</city>
<region>München</region>
<state>Bayern</state>
<country iso-cc="DEU">Deutschland</country>
</location>

</identified-content>
</docdata>
</head>
<body>
...
</body>
</nitf>

I’ve chosen this story because it is about a soccer game, an example scenario i used in my last post. So we encoded three scopes and one address.

Since it is the a third league game, the editors chose to select only administrative regions covering the cities on a  county level. One city (Munich) is actually divided into two counties, hence the sum of three counties.

If it would have been a premier league game, most likely there only would have been a single scope, the whole of germany whereas a second leugue game would presumably be encoded with some states.

The addresss represents the address of the stadium where the soccer game took place.

So let’s have a closer look at the example ‘s representation.

Representing scopes

<location>
<region region-code="09184000" code-source="AGS">München
	<georss:point>11.5725580365 48.1379548096</georss:point>
</region>
<state state-code="09000000" code-source="AGS">Bayern
	<georss:point>11.5725580365 48.1379548096</georss:point>
</state>
<country iso-cc="DEU">Deutschland</country>
</location>

Remarks:

  • NITF already provides attributes called xxxx-code and code-source for all possible subtags of location, and since we are primarily using the official german coding scheme for administrative regions called “Amtlicher Gemeinde Schlüssel” short: it is natural to encode it  the way we do .
  • The coding scheme of AGS is actually a hierarchically coding scheme (two digits: state, 1-digit: sub-state level (“Regierungsbezirk”), 3-digits: county, 3-digits: city/town) , hence we could do away with the state tag but we decided to be as explicit as we could be.
  • Since we were using the three-letter variant of ISO3166 for the evloc tag we decided to use this variant also for the iso-cc attribute of the country tag.
  • Since we introduced scopes first and some customers wanted to include markers-on their maps they asked for some coordinates. Hence we chose to include the “official” coordinates of the admin region, denoted in some other GIS dataset we bought and chose to make use of simple georss:point tag for doing so
    • We were not allowed to distribute the geometries of the admin regions as part of our licensing deal (Yes you have to buy this data in germany) and the geometries would have used far too much bandwidth for sending them within the wire.
    • In hindsight i would like to remove the coordinates from scope items since the are  a) highly redundant, b) not always available and c) a constant source of discussion what an appropriate representative coordinate for a geographic extent might be
  • We currently use other coding-schemes on a sub-city level for some cities (Also official coding schemes by the city goverment). But since these are hard to come by on a national level, we are currently considering alternatives
  • We are also considering to extend the geocoding to our non-regional, i.e. national and international wires. Her we are looking into using the ISO3166-2 coding scheme and the NUTS3 coding scheme for the European Union

Representing Addresses

<location>
Grünwalder Stadion, Grünwalder Straße, München, Germany
	<georss:point>11.566936 48.101078</georss:point>
<city>München</city>
<region>München</region>
<state>Bayern</state>
<country iso-cc="DEU">Deutschland</country>
Remarks:
  • Addresses are provided by the editor.
  • The level of detail (exact address, strret level, district or city) presented is an editorial decision based on data protection regulations.
  • The address is then geocoded by Google Maps Premiere and the resulting coordinates and the  address returned by the geocoder are shown to the editor and validated by him
  • The this information, togehter with a label of the address is encoded into an NITF location tag in the form: label, address
  • The returned coordinates are also encoded into a georss:point tag.
  • region, state and country are taken from the respective fields of the structured response of the Google geocoder. Hence they might differ in writing from the respective official names. But we chose not to do point in polygon queries in order to harmonize becuase this would have resulted in running a spatially enabled database e.g. Postgres/PostGis.

Customer Uses

I just wanted to give some quick examples how our customers uses the geocodes in the wire.

First an iPhone App that uses the address coordinates to put the news on the map. A typical news map:

D-Ticker Screenshot D-Ticker Scrennshot dticker5

At the other end of the range is the way germany’s biggest tabloid Bild is using the scope information for automatically sorting the news into their different regiona portals. The following screen shots show how content from  is sorted into three diffent regional portals within the state of Northrhine-Westphalia. News that have a scope of the whole state show up in all three portals, whereas news only having a scope of one or more counties are sorted into the regionl portals that contain these counties (better: the AGS codes of thes counties).

Bild Regional Ruhrgebiet Bild Regional Köln Bild Regional Düsseldorf

Next steps

I’m planning to catch up with other aspects of geocoding at dpa in the next days so that i’m finally able to start writing about new ideas :-)

Written by gkamp

October 21st, 2009 at 5:39 pm

Posted in Noteworthy

Tagged with , , ,

DocumentCloud and OpenCalais: Some Questions

2 comments

Recently another KnightNews challenge winner announced the availability of the open source version of the code. This time DocumentCloud, a joined effort of NYT and ProPublica (not sure why these bigshots need grant money to do these things, but this is another story). It is opensourcing CrowdCloud which claims:  Parallel processing  for the rest of us.

Yesterday it announced another two-dozenhigh profile content partners (Nieman Labs view on this) as well as a partnership with ThomsonReuters OpenCalais (DocumentCloud Blog Post):

This morning we’re excited to announce a partnership with Thomson Reuters, which is contributing its OpenCalais service to DocumentCloud. OpenCalais uses natural language processing to extract information from documents, instantly identifying and tagging the relevant people, places, companies, facts and events. This will make it easy for readers and journalists to explore connections between documents and across the full collection of source materials.

I’m very excited to use DocumentCloud / CrowdCloud but i have a couple of questions regarding the OpenCalais Terms of Service. Since i’m not sure when they’ll make it through moderation, i’m reposting them here:

Can you (and Thomson Reuters) please clarify if you are using the public free version of OpenCalais. If so it would be very helpful to get your reading of the terms of service. Until now the terms were the reason that i’m very hesistant to use OpenCalais for tasks at my news org.

Since i would very much love to use OpenCalais and DocumentCloud it would be very helpful for me to get more information on your interpretation to the following parts of the terms:

1. As far as I understand the Terms of the service of the public version not only allow Reuters to keep and use the metadata (with some rumour that the full text is part of the metadata).


You understand that Thomson Reuters will retain a copy of the metadata submitted by you or that generated by the Calais service. By submitting or generating metadata through the Calais service, you grant Thomson Reuters a non-exclusive perpetual, sublicensable, royalty-free license to that metadata.”

Since Reuters somehow has to refinance the operation of OpenCalais i’m basically fine with that clause but it would be interesting to know about the types of services and products they are sublicensing the metadata to.

2. IMHO the terms make it at least difficult to use other Metadata extraction means e.g Homegrown NLTK / GATE jobs, Metacarta API, inxight, empolis, … etc. or offering this metadata as part of your own api e.g. the NYT API.

“# If you syndicate, publish or otherwise transmit any content containing, enhanced by or derived from Calais-generated metadata you will use your best efforts to incorporate the correct Calais-provided Globally Unique Identifier (GUID) in that content. You specifically agree not to attach incorrect GUIDs to your content with any intent to mislead, spam, spoof, phish or otherwise deceive downstream consumers of your content.

# You will not use any metadata or GUIDs produced by Calais to create a metadata retrieval service similar to Calais. To ensure the quality of metadata for all Calais users we want to maintain a single verifiable metadata storage location.”

I read these clauses such that e.g.the NYT Times API (as among other things a metadata retrieval service for people, persons and places) is not allowed to use the public OpenCalais service as part of its processing. Is my interpretation too strict? I’m basically talking about open Calais as a preprocessing step where the results would be curated by human beings

BTW: The last sentence of that quote looks very strange to me give the “Linked Open Data” initiative, including Freebase, DBPedia etc which all provide their ow GUIDs.

3. One clause of the terms for me looks like DocumentCloud is in direct violation of it:

“You will not do bulk processing where you are adding minimal value beyond adding Calais metadata to the content. For example – if you are a webcrawler you should not send everything to Calais before sending it to your users.”

Since DocumentCloud is all about bulk processing: Was this claused waived for DocumentCloud (including all uses of DocumentCloud in outside the original partners installation? E.g. Systems  derived from DocumentCloud / github clones, … Or does it mean that i cannot do only Metadata annotation on a DocumentCloud job but have to do some other things in the same job too?

I hope that most if not all of these questions have already been asked and answered by the various content partners and it’s easy for you to answer them.

Written by gkamp

September 25th, 2009 at 6:52 am

(Centralized) URL shorteners considered harmful

one comment

In late April i started writing this post and it was lying around unfinished all these months. The impetus for the post were  a number of discussions i had whether URL shorteners are a good thing or not. (My position was along the lines of this BoingBoing post by Cory Doctorow)

Given the (recent) developments with Digg, cli.gs and tr.im i finally decided to finish the post(s): Here is the short version (Update: I started to elaborate on the points below in a follow up post ):

  1. Centralized URL Shorteners are considered harmful
  2. Serious content providers simply cannot rely on them due to quality of service reasons
  3. The need for shorturls within Twitter is arbitrarily imposed by Twitter, and can and should easily be changed by Twitter
  4. There are cases where content provider have a real need for short URLs. But short in that cases means around 30 chars in the worst case (newspaper columns) not 15.
  5. Most of the content providers already can provide this kind of short urls using a second-level domain of 10 – 15 chars and the ID of the content within their CMS (or a Base62 encoded random ID)
  6. rev=”canonical” and/or rel=”alternate shorturl” are ways to announce that short URL to others that might be interested in your content. Use it and ask for support of this in your CMS (or build it)
  7. Realtime statistics are another (if not the) reason why centralized URL shorteners are used by many people. This kind of statistics should already be available in your CMS. If not you’re not really a serious content provider.
  8. If you really need real-time statistics for other peoples content, either use a redirecting URL on your own domain (as has been done for 10+years) or
  9. Run your own little URL shortener that is fully under your control , only writable to your staff and  integrated / integratable into your CMS.

Thinking about how to solve the real-time statistics dilemma the real-time the following bold / crazy idea was born:

What about the content providers opening  up  their access statistics themselves instead of having bit.ly etc. doing it for them.

This would make sure that all people can see the complete picture and not only some potentially twisted fragment provided by an URL Shortener service. Most content providers  already have a most emailed, best rated etc. section on their pages. It would also provide a much needed transparency in a link  economy as well as provide a decentralized solution for an apparent need of the people using the web. They want to know about how they contribute to the success of

Opening up the statistics like bit.ly and tr.im are doing it is IMHO the right way:

  • Everybody sees the summarized results for the page (The decision of the level of detail provided is up to the content provider)
  • Authenticated users can see the traffic that came from their registered  domains
  • Access via the web site and an API

Some first implementation ideas:

  • Authentication via OpenID /OAuth
  • Domain ownership verification like Google is doing for Google Apps etc.
  • Encapsulatin of the whole thing into plugins for blogs software and CMS

What do you think?

Written by gkamp

August 12th, 2009 at 9:04 am

Posted in Noteworthy

Tagged with

Hamburg Declaration Wording differs from Hamburger Erklärung

8 comments

Hamburg Declaration signage event in Berlin June 25th 2009

Hamburg Declaration signage event in Berlin June 25th 2009

Last Thursday the “Hamburger Erklärung” has been presented to the EU commision as a petition now called “Hamburg Declaration”. Seemingly there was a “signing ceremony” at a joint conference of the European Publishers Council (EPC) and tne World association of Newspapers (WAN) on June 26th.

Hopefully all these very important men  didn’t convene only for signing of the declaration, think about the carbon footprint and the effect to your bottom line.

Interestingly the english wording differs from the german  in quite some  ways.  The last sentence which would have translated to “No knowledge is ever created without getting a fair share of  its economic proceeds” (which is of course unfortunately not true) has been deleted completely. Others get a slighty different twist .

E.g. it is talked about “professional journalism” and not “journalism” in the lede sentence. “Wirtschaftliche Basis” which in german would also include operating at no loss like non-profits do is changed into “profitability”.

“Qualitäts-Journalismus” gets an upgrade to “High-Quality”-Journalism. The improvements are now “urgent”.  The german legal term “Werkmittler” is translated into “publishers and broadcasters”.

Whereas in the german version the resolve  of legislators  to “change” the rights of authors and werkmittler this is reduced to “support” in the english version.

All in all i  think that my critique of the argumentation is still  valid (sorry german only) .

English: German

The Internet offers immense opportunities to professional journalism – but only if the basis for profitability remains secure throughout the digital channels of distribution. This is currently not the case.

Numerous providers are using the work of authors, publishers and broadcasters without paying for it. Over the long term, this threatens the production of high-quality content and the existence of independent journalism.

For this reason, we advocate strongly urgent improvements in the protection of intellectual property on the Internet.

Universal access to websites does not necessarily mean access at no cost. We disagree with those who maintain that freedom of information is only established when everything is available at no cost.

Universal access to our services should be available, but going forward we no longer wish to be forced to give away property without having granted permission.

We therefore welcome the growing resolve of federal and state governments all over the world to continue to support the protection of the rights of authors, publishers and broadcasters on the Internet.

There should be no parts of the Internet where laws do not apply. Legislators and governments at the national and international level should protect more effectively the intellectual creation of value by authors, publishers and broadcasters. Unauthorized use of intellectual property must remain prohibited whatever the means of distribution.

Ultimately, the fundamental principle that no democracy can thrive without independent journalism must also apply to the World Wide Web.

Berlin, June 26th 2009

Das Internet ist für den Journalismus eine große Chance. Aber nur, wenn die wirtschaftliche Basis auch in den digitalen Vertriebskanälen gesichert bleibt. Das ist derzeit nicht der Fall.

Zahlreiche Anbieter verwenden die Arbeit von Autoren, Verlagen und Sendern, ohne dafür zu bezahlen. Das bedroht auf die Dauer die Erstellung von Qualitäts-Inhalten und von unabhängigem Journalismus.

Wir treten deswegen entschieden dafür ein, den Schutz geistigen Eigentums im Internet weiter zu verbessern.

Freier Zugang zu Webseiten bedeutet nicht zwingend kostenlosen Zugang. Wir widersprechen all jenen, die behaupten, dass Informationsfreiheit erst hergestellt sei, wenn alles kostenlos zu haben ist.

Der freie Zugang zu unseren Angeboten soll erhalten bleiben, zum Verschenken unseres Eigentums ohne vorherige Zustimmung möchten wir jedoch nicht gezwungen werden.

Wir begrüßen deshalb die wachsende Entschlossenheit von Bundesregierung, Landesregierungen und den im Bundestag vertretenen Parteien, die Rechte von Urhebern und Werkmittlern weiter an die Bedingungen des Internets anzupassen.

Im Internet darf es keine rechtsfreien Zonen geben. Gesetzgeber und Regierung auf nationaler wie internationaler Ebene sollten die geistige Wertschöpfung von Urhebern und Werkmittlern besser schützen. Ungenehmigte Nutzung fremden geistigen Eigentums muss verboten bleiben.

Am Ende muss auch im World Wide Web gelten: Keine Demokratie gedeiht ohne unabhängigen Journalismus. Kein Wissen entsteht ohne faire Beteiligung an seinem wirtschaftlichen Ertrag.

Signatories as of July 9th

For those who want to know who has signed until July 9th i provide a list below. EPC is only doing  a PDF. So much for digital native journalism.

So everybody who wants to see if “his” publisher has signed, have a look. Or if you want to crosscheck your address book. I will upload the list to Google Docs and post the link later today

International

  1. Bonnier AB, Carl-Johan Bonnier, Chairman
  2. Der Standard, Oscar Bronner, Publisher & Editor in Chief
  3. Daily Mail and General Trust, The Rt. Hon. The Viscount Rothermere, Chairman
  4. Dow Jones Wall Street Journal, Robert Thomson Editor-in-Chief,Managing Editor
  5. Editoriale L’Espresso, Dr. Carlo de Benedetti, Chairman & CEO
  6. Financial Times Group, Ms Rona Fairhead, CEO
  7. Groupe Hersant Media, Frédéric Aurand, President
  8. Impresa, Francisco Pinto Balsemão, Chairman and CEO
  9. Independent News & Media PLC, Sir Anthony O’Reilly, President Emeritus
  10. Independent News & Media PLC, Gavin O’ Reilly, CEO
  11. Legardère, Didier Quillot, Chairman & CEO
  12. Milliyet, Hanzade Dogan, CEO
  13. News Corporation, James Murdoch, Chairman & CEO Europe and Asia
  14. de Persgroep, Christian Van Thillo, CEO
  15. RCS Quotidiani, Giorgio Valerio, CEO
  16. Reed Elsevier, Ian Smith, CEO
  17. Ringier, Michael Ringier, President
  18. Sanoma Corporation Finland, Hannu Syrjanen, CEO
  19. Styria, Horst Pirker, CEO
  20. Telegraaf Media Group, Patrick Morley, COO

Germany
Newspapers

  1. Abendzeitung, München, 17.06.2009
  2. Allgäuer Zeitungsverlag GmbH, Kempten, 16.06.2009
  3. Alois Erdl, Trostberg, 24.06.2009
  4. Backnanger Kreiszeitung, Backnang, 17.06.2009
  5. Badischer Verlag GmbH, Freiburg, 18.06.2009
  6. Badisches Tagblatt GmbH, Baden-Baden, 16.06.2009
  7. Bayerische Rundschau, Kulmbach, 17.06.2009
  8. Bremer Tageszeitungen AG
  9. Der Neue Tag, Weiden, 17.06.2009
  10. Donaukurier, Ingolstadt, 17.06.2009
  11. Esslinger Zeitung, Esslingen, 16.06.2009
  12. Fränkische Nachrichten Verlags GmbH, Tauberbischofsheim, 26.06.2009
  13. Fränkischer Tag, Bamberg, 22.06.2009
  14. Gäubote Herrenberg, Herrenberg, 16.06.2009
  15. Geislinger Zeitung Verlags-GmbH & Co. KG, Geislingen, 16.06.2009
  16. Hans Fahner GmbH, Lauf, 24.06.2009
  17. Haßfurter Druck & Verlag GmbH, 16.06.2009
  18. Heidenheimer Zeitung GmbH & Co. KG, Heidenheim, 16.06.2009
  19. Heilbronner Stimme, Heilbronn, 16.06.2009
  20. Hersbrucker Zeitung, Hersbruck, 23.06.2009
  21. Hofer Anzeiger, Hof, 16.06.2009
  22. Jüdische Presse GmbH, Berlin, 19.06.2009
  23. Kreiszeitung, Böblinger Bote, Böblingen, 16.06.2009
  24. Kurier GmbH & Co., Bayreuth, 24.06.2009
  25. Lahrer Zeitung GmbH, Lahr, 16.06.2009
  26. Lausitzer Rundschau, Cottbus, 19.06.2009
  27. Magdeburger Volksstimme, Magdeburg, (vorerst mündliche Zusage)
  28. Mediengruppe Main-Post, Würzburg, 24.06.2009
  29. Mühlacker Tagblatt, Mühlacker, 16.06.2009
  30. Murrhardter Zeitung, Murrhardt, 16.06.2009
  31. Oberbayerisches Volksblatt, Rosenheim, 18.06.2009
  32. Presse-Druck- und Verlags-GmbH, Augsburg, 16.06.2009
  33. Rems-Zeitung, Schwäbisch Gmünd, 16.06.2009
  34. Schwäbischer Verlag GmbH & Co. KG, Leutkirch, 16.06.2009
  35. Schwarzwälder Bote, Oberndorf, 16.06.2009
  36. sh:z Schleswig-Holsteinischer Zeitungsverlag, GmbH, Flensburg 26.06.2009
  37. Straubinger Tagblatt, Straubing, 16.06.2009
  38. Südkurier Medienhaus, Konstanz, 19.06.2009
  39. Südwest Presse/Die Neckarquelle, Villingen-Schwenningen, 18.06.2009
  40. Traunsteiner Tageblatt, Traunstein, 16.06.2009
  41. Verlag “Der Bote” GmbH & Co, Feucht, 17.06.2009
  42. Verlag der Nürtinger Zeitung, Nürtingen, 18.06.2009
  43. Verlag M. DuMont Schauberg, Köln (telefonische Info), 25.06.2009
  44. Verlag Nürnberger Presse GmbH, Nürnberg, 18.06.2009
  45. Verlagsgruppe Handelsblatt GmbH, Düsseldorf, 18.06.2009
  46. WAZ Mediengruppe, Essen,
  47. Windsheimer Zeitung, Bad Windsheim, 16.06.2009
  48. Zeitungsverlag Kornwestheim GmbH, Kornwestheim, 23.06.2009
  49. Zeitungsverlag Schwäbisch Hall GmbH, 17.06.2009
  50. Zeitungsverlag Waiblingen GmbH & Co. KG, Waiblingen, 16.06.2009

Magazines

  1. Absolut Research GmbH, Hamburg, Michael Busack, GF
  2. ABW Wissenschaftsverlag GmbH, Berlin, Dr. Axel Bedürftig, GF
  3. Analytic Journal GmbH, Berlin, Dr. Rainer Didszuhn, GF
  4. Atlas  Spezial GmbH, München, Philip Artopé, GF
  5. Audimax Medien, Nürnberg, Oliver Bialas, GF
  6. Automotive IT , Hannover, Dominik Ortlepp, GF
  7. AVA Verlag Allgäu GmbH, Wolfgang Kühnle, GF Gesellschafter
  8. aweto Verlag, Meckenheim, Friedhelm Todtenhöfer, Verleger
  9. Axel Springer AG, Berlin, Dr Mathias Döpfner,
  10. BackMedia Verlagsgesellschaft mbH, Bochum, Trond Patzphal, GF
  11. Bank-Verlag Medien GmbH, Köln, Sebastian Stahl, VL
  12. Bauer Media Group, Hamburg, Andreas Schoo Mitglied der Geschäftsleitung
  13. Beckmann Verlag GmbH & Co. KG, Lüneburg, Jan-Klaus Beckmann, GF
  14. Bernward Mediengesellschaft mbH, Hildesheim, Thomas Hagenhoff, GF
  15. Bild digital GmbH &Co.KG, Berlin, Erik Peper, GF
  16. b-Quadrat Verlags GmbH & Co. KG, Kauforing, Wolfgang Klinker, GF
  17. Bund Verlag GmbH, , Rainer Jöde, Verlagsleiter (VL)
  18. BVA Bielefelder Verlag, Bielefeld, Hans-Jörg Kaiser, GF
  19. CLIPS Verlags GmbH, Köln, Heidrun Barbie, GF
  20. Dähne Verlag GmbH, Ettlingen, Marc  Dähne, Gernot Dähne, GF
  21. Delius Klasing Verlag, Bielefeld, Konrad Delius, GF
  22. Deutscher Ärzte-Verlag GmbH, Köln, Dieter Weber, GF
  23. Deutscher Landwirtschaftsverlag GmbH, München, Amos Kotte, VL
  24. Deutscher Psychologen Verlag GmbH, Berlin, Ina Jungbluth, GF
  25. Dr. Neinhaus Verlag AG, Stuttgart, Kornelia Dewald,
  26. DVS Media GmbH, Düsseldorf, Dirk Sieben, Vertriebsleiter
  27. EuroTransport Media Verlag, Stuttgart, Werner Bicker, GF
  28. Evangelische Gemeindepresse GmbH, Stuttgart, Bernd Friedrich, GF
  29. Evangelische Verlagsanstalt GmbH, Leipzig,Bert Petzold, GF
  30. Fachverlag Hans Carl GmbH, Nürnberg, Michael Schmitt, GF
  31. Fachverlag Schiele & Schön GmbH, Düsseldorf, Harald Rauh Geschäftsführer (GF)
  32. Fitness Management Internation, Hamburg, Birgit Schwarze GF + VL
  33. GOVI-Verlag Pharmazeutischer Verlag GmbH, Eschborn, Hartmut Schmitt GF
  34. Gruner + Jahr GmbH & Co. KG, Dr. Bernd Buchholz, Vorstand
  35. Gupta Verlag, Ratingen, Dr. Heinz Gupta, GF
  36. GW-Verlag GmbH, Essen, Dietmar Huber, GF
  37. Hans Müller Verlag, Hamburg, Gerhard Melchert, GF
  38. Haymarket Media GmbH, Hamburg/Braunschweig, Dr. Nicolas Bogs, GF
  39. Heise Zeitschriften Verlag GmbH & Co. KG,  Hannover, Steven P. Steinkraus, GF
  40. Hubert Burda Media Holding GmbH, München, Prof. Dr. Hubert Burda, Verleger
  41. hw – Studio Weber Werbung und Verlag, Leinersheim, Hans Weber, Verleger
  42. IDG Communications Media  AG, München, York von Heimburg, Vorstand
  43. Kirchenbote des Bistums Osnabrück, , Theo Mönch-Tegeder, Verlagsleiter
  44. Kirschbaum Verlag GmbH, Bonn, Bernhard Kirschbaum, GF
  45. Klambt Verlag, Speyer, Lars Joachim Rose, Verleger
  46. KomPart Verlagsgesellschaft mbH & Co. KG, Berlin, Werner Mahlau, GF
  47. Krafthand Verlag, Bad Wörishofen, Gottfried Karpstein, GF
  48. kresse & discher, Ottenburg, Klaus Kresse, GF-Gesellschafter
  49. Krupp-Verlags GmbH, Sinzig, Hermann Krupp, GF
  50. Kuberski Verlag GmbH, Stuttgart, Dieter Kuberski, GF
  51. Landwirtschaftsverlag Hessen GmbH, Friedrichsdorf, Peter Voss-Fels, GF
  52. Leipziger Verlagsanstalt GmbH, Dr. Rainer Stumpe,
  53. Max Schmidt Römhild KG, Essen, Norbert Beleke, GF
  54. MedienPro Verlagsgesellschaft mbH, Meerbusch, Bernd Gey, GF
  55. Medienverband der EK im Rheinland, Düsseldorf, Dr. Lars Tutt, GF
  56. Meisenbach GmbH,  Bamberg, Christine Dicker, GF
  57. Motor Presse Stuttgart GmbH & Co. KG, Stuttgart, Alexander Grzegorzewski, Stellv. GF Automobile
  58. MTM Verlag, München, Wilfried E. Matthäus, GF
  59. Neue Mediangesellschaft, Ulm, Thomas Perskowitz, GF
  60. Neureuter Fair Media, Essen, Peter Schuck, GF
  61. NWB Verlag, Herne, Dr. Ludger Kleyboldt, GF
  62. Olympia-Verlag GmbH, Nürnberg, Toni Schnell, GF
  63. Publish-Industry Verlag, München, Kilian Müller, GF
  64. Ringier Publishing GmbH, Berlin, Martin Paff, GF
  65. rs media GmbH, Regensburg, Adi  Rixner, GF
  66. Saatkorn-Verlag GmbH, Lüneburg, Eckhard Boettge, GF
  67. Sankt Michaelsbund Diözesanverband, München, Dr. Erich Jooß, VL
  68. Schlütersche Verlagsgesellschaft mbH & Co. KG, Hannover, Stefan Schnieder, Leiter Personal und Recht
  69. Siegel Verlag, Frankfurt, Joachim Müller, GF
  70. SIGS DATACOM, Troisdorf, Günter Fuhrmeister, GF-Gesellschafter
  71. Spa business Verlag, Bad Boll, Birgit Wolfhard, GF
  72. Spotlight Verlag GmbH, Planegg, Dr. Wolfgang Stock, GF
  73. Springer-VDI-Verlag, Düsseldorf, Christian W. Scheyko, GF
  74. Staatsanzeiger für Baden-Württemberg, Stuttgart, Joachim Ciresa, Verlagsleiter
  75. Stiebner Verlag GmbH, München, Dr. Jörg D. Stiebner GF
  76. STROBEL VERLAG GmbH & Co. KG, , Christopher Strobel, GF
  77. TV Trend Verlag, Herten, Arno Welke, GF
  78. Union Betriebs-GmbH, Rheinbach, Bernd Profittlich,
  79. Universum Verlag GmbH, Wiesbaden, Siegfried Pabst, Frank-Ivo Lube, GF
  80. Un-plaqued, Berlin, Ingmer Dobberstein, Chefredakteur
  81. VDE Verlag GmbH, Berlin, Margret Schneider, GF
  82. Verlag Bau – Technik GmbH, Erkrath, Rainer Büchel GF
  83. Verlag Bayernkurier, München, Reinhard Schaefer, VL
  84. Verlag Chmielorz GmbH, Wiesbaden, Andreas Klein, GF
  85. Verlag Eugen Ulmer KG, Stuttgart, Gerd Friedrich, GF
  86. Verlag Friedrich Bischoff GmbH, Frankfurt, Dr. Hans-Jürgen Hendrieck, GF
  87. Verlag Kirchheim + Co. GmbH, Mainz, Manuel  Ickrath, GF
  88. Verlag Stahleisen GmbH, Düsseldorf, Adrian Schommers, GF
  89. Verlag Sternefeld GmbH & Co. KG, Düsseldorf, Michael Brumme, GF
  90. Verlag Werben&Verkaufen GmbH, Jochen Kolka, GF
  91. Verlagsanstalt Handwerk GmbH, Düsseldorf, Hans Jürgen Below, GF
  92. Verlagsgesellschaft Rudolf Müller GmbH & Co. KG, Köln, Dr. Christoph Müller, GF
  93. Verlagsgruppe Georg von Holtzbrinck GmbH, Dr. Stefan von Holtzbrinck, GF
  94. Verlagsgruppe Handelsblatt GmbH, Düsseldorf, Dr. Tobias Schulz-Isenbeck, GF
  95. Verlagsgruppe Rheinischer Merkur, Bonn, Bert G. Wegener, GF
  96. Vincentz Network GmbH & Co. KG, Hannover, Dr. Lothar Vincentz, GF
  97. Virto GmbH, Linz/Rhein, Dieter Roßbach, Inhaber/Gesellschafter
  98. Vogel Business Media GmbH & Co.KG, Würzburg, Stefan Rühling, GF
  99. VWEW Energieverlag GmbH, Heidelberg, Frieder Mohr, Bereichsleister

Written by gkamp

July 14th, 2009 at 8:03 am

Wortlaut der Hamburger Erklärung auf dem Mediendialog – Und meine $0.02

7 comments

In den letzten Wochen hatte ich an verschiedenen Stellen Gerüchte über eine “Hamburger Erklärung” gehört, die sich für eine Änderung des Urheberrechtes zugunsten der Verlage einsetzen  und die insbesondere die von ASV wesentlich getriebene Kampagne für ein Leistungsschutzrecht für Verlage vorantreiben soll. Diese erklärung sollte im Rahmen des Internationalen Mediendialoges, der gestern stattfand, erfolgen.

Bem.: Also ähnlich wie der unsägliche Heidelberger Appell. Wer sich dafür interessiert, warum ich unsäglich im Zusammenhang mit dem Heidelberger Appell verwende, der lese bitte die entsprechenden Posts von Matthias Spielkamp auf immateriblog. Mich stört insbesondere die Vermengung  von Google Book Search und Open Access, zwei Dingen die aber überhaupt nichts miteinander zu tun haben.

Daher war ich gespannt ob  diese Erklärung tatsächlich veröffentlich werden würde. Via Twitter konnte ich erfahren dass die Erklärung von den Hamburger Großverlagen abgegeben wurde und von der dpa unterstützt wird. (Disclosure: Ich arbeite für eine dpa Tochter)- darüberhinaus gabe es noch eine Reihe weiterer Erklärungen

Über die Tweets mit Hashtags #imd09 und ein Paar Meldungen, die schon gestern lesen konnte, wusste ich, dass

  • in der Keynote von Herrn Döpfner die Worte “Hehlerware im Internet” fielen,
  • in der Erklärung  (mal wieder) vom Internet als rechtsfreien Raum die Rede ist, und
  • in der Rede von  Wasserzeichen als Allheilmittel gesprochen wurde.

Soviel hatte ich gestern  mitbekommen. Da ich aber gestern und heute auf einer anderen Veranstaltung war, komme ich erst jetzt dazu mich darüber intensiver zu informieren.

Unglücklicher-, aber nicht überraschenderweise konnte ich weder den Wortlaut der Rede von Herr Döpfner  noch ein Video des Vortrages im Internet zu finden. Bei einer Veranstaltung, die dem Medium Internet gerecht werden will darf dass nicht passieren.

Aber auch der Worlaut der Erklärung ist nicht einfach so zu finden. Weder auf der Seite des Mediendialoges noch auf den Presse-Webseiten der Verlage ist sie zu finden. Wäre auch zu viel verlangt. Da ist sogar der Heidelberger Appell noch besser, den kann man wenigstens leicht finden.

Zum Glück haben  die Welt und die FAZ die Erklärung im Rahmen ihrer Berichterstattung veröffentlicht, eigentlich eine Selbstverständlichkeit für jeden der versteht wie das Medium Internet funktioniert.  Daher auch nochmal  hier.

Die Hamburger Erklärung im Wortlaut

Das Internet ist für den Journalismus eine große Chance. Aber nur, wenn die wirtschaftliche Basis auch in den digitalen Vertriebskanälen gesichert bleibt. Das ist derzeit nicht der Fall.

Zahlreiche Anbieter verwenden die Arbeit von Autoren, Verlagen und Sendern, ohne dafür zu bezahlen. Das bedroht auf die Dauer die Erstellung von Qualitäts-Inhalten und von unabhängigem Journalismus.

Wir treten deswegen entschieden dafür ein, den Schutz geistigen Eigentums im Internet weiter zu verbessern.

Freier Zugang zu Webseiten bedeutet nicht zwingend kostenlosen Zugang. Wir widersprechen all jenen, die behaupten, dass Informationsfreiheit erst hergestellt sei, wenn alles kostenlos zu haben ist. Der freie Zugang zu unseren Angeboten soll erhalten bleiben, zum Verschenken unseres Eigentums ohne vorherige Zustimmung möchten wir jedoch nicht gezwungen werden.

Wir begrüßen deshalb die wachsende Entschlossenheit von Bundesregierung, Landesregierungen und den im Bundestag vertretenen Parteien, die Rechte von Urhebern und Werkmittlern weiter an die Bedingungen des Internets anzupassen.

Im Internet darf es keine rechtsfreien Zonen geben. Gesetzgeber und Regierung auf nationaler wie internationaler Ebene sollten die geistige Wertschöpfung von Urhebern und Werkmittlern besser schützen. Ungenehmigte Nutzung fremden geistigen Eigentums muss verboten bleiben.

Am Ende muss auch im World Wide Web gelten: Keine Demokratie gedeiht ohne unabhängigen Journalismus. Kein Wissen entsteht ohne faire Beteiligung an seinem wirtschaftlichen Ertrag.

Hamburg, 8. Juni 2009

Axel Springer AG

Bauer Media Group

Ganske Verlagsgruppen GmbH

Gruner + Jahr AG & Co KG

Spiegel Verlag Rudolf Augstein GmbH & Co KG

Zeitverlag Gerd Bucerius GmbH & Co. KG

Neben der Erklärung der Verlage gab es wohl auch noch Erklärungen des Gesamtverband Kommunikationsagenturen GWA, der Allianz Deutscher Filmproduzenten (Film/TV) und des Bundesverband Musikindustrie. Natürlich fordern alle eine Erweiterung der Urheber und sonstiger Rechte. Und Ole von Beust hat erklärt, dass den Worten nun Taten folgen sollen. (Horizont.Net).

Vielleicht sollte man Herr von Beust mal die wissenschaftlichen Untersuchungen von Rufus Pollock zu der volkswirtschaftlich optimalen Länge des Copyrights näher bringen (und vielleicht zur Sicherheit noch erklären was ein Konfidenzintervall ist) (Blog, Wissenschaftliches Papier (PDF) ):

FOREVER MINUS A DAY? CALCULATING OPTIMAL COPYRIGHT
TERM
RUFUS POLLOCK
UNIVERSITY OF CAMBRIDGE
JANUARY 5, 2009
Abstract. The optimal term of copyright has been a matter for extensive debate over
the last decade. Based on a novel approach we derive an explicit formula which charac-
terises the optimal term as a function of a few key and, most importantly, empirically-
estimable parameters. Using existing data on recordings and books we obtain a point
estimate of around 15 years for optimal copyright term with a 99% confidence interval
extending up to 38 years. This is substantially shorter than any current copyright term
and implies that existing terms are too long.

Update: Ich habe erst jetzt (via Telepolis) erfahren, dass auch der Dietmar Harhoff, Professor am Institut für Innovationsforschung an der Ludwig-Maximilians-Universität München, und Vorsitzender der Expertenkommission Forschung und Innovation, die die Bundesregierung in forschungspolitischen Fragen berät, basierend auf den Forschungsergebnissen von Pollock  aus ökonomischen Gründen eine Verkürzung des Urheberrechts vorschlägt. Und zwar je nach Produkt zwischen fünf und dreißig Jahren statt wie die EU-Kommission es möchte, eine Verlängerung auf 70 Jahre.

Meine $0.02

Der Text der Erklärung kann mir leider nur ein unverständliches Kopfschütteln entlocken. Kurz ein paar Anmerkungen zu den einzelnen Erklärungsbestandteilen:

Das Internet ist für den Journalismus eine große Chance.

Na wenigstens das ist unstrittig

Aber nur, wenn die wirtschaftliche Basis auch in den digitalen Vertriebskanälen gesichert bleibt. Das ist derzeit nicht der Fall.

Das gilt vielleicht momentan für die meisten klassischen Verlage, allerdings wird die Argumentation für Herr Döpfner schwieriger wenn er gleichzeitg verkündet, dass ASV 17% des Konzernumsatzes über digitale Vertriebswege erwirtschaftet. Auch gibt es durchaus schon Beispiele dafür dass man mit Journalismus Online Geld verdienen kann. Und es gibt jede Menge Journalismus im Netz für den die wirtschaftliche Basis sekundär ist und für den andere Motivationen und Incentives wichtiger sind.

Zahlreiche Anbieter verwenden die Arbeit von Autoren, Verlagen und Sendern, ohne dafür zu bezahlen. Das bedroht auf die Dauer die Erstellung von Qualitäts-Inhalten und von unabhängigem Journalismus.

In zahlreichen Szenarien ist diese Verwendung gesetzlich zulässig (Zitatrecht etc.) Und um es hier direkt anzusprechen: Die Praxis von Google News ist, was die Texte angeht durch das “Paperboy”-Urteil des Bundesgerichthofes quasi höchstrichterlich abgesegnet. Deutschland ist also im Vergleich zur USA, in der die “Fair-Use-Doctrine” noch nie vor Gericht war, der “Safe-Haven”.

In den Fällen in denen es gesetzlich nicht zulässig ist, gibt es Methoden und Verfahren wie dann vorzugehen ist. Diese können und sollen von den Erstellern von Qualitäts-Inhalten und unabhängigem Journalismus eingesetzt werden nicht nur von Marion’s Kochbuch etc.

Wir treten deswegen entschieden dafür ein, den Schutz geistigen Eigentums im Internet weiter zu verbessern.

Es gibt also einen Schutz geistigen Eigentums im Internet, sonst könnte er nicht weiter verbessert werden.. Wir merken uns das mal für gleich.

Freier Zugang zu Webseiten bedeutet nicht zwingend kostenlosen Zugang. Wir widersprechen all jenen, die behaupten, dass Informationsfreiheit erst hergestellt sei, wenn alles kostenlos zu haben ist. Der freie Zugang zu unseren Angeboten soll erhalten bleiben, zum Verschenken unseres Eigentums ohne vorherige Zustimmung möchten wir jedoch nicht gezwungen werden.

Habe ich was verpasst? Gibt es eine breite gesellschaftliche oder politische Bewegung die fordert das alle Inhalte kostenlos zu haben sein sollen? Oder wurden die Inhalte von den Verlagen auf freiwilliger Basis kostenlos ins Netz gestellt. Oder wird hier ein irreales Bedrohungsszenario konstruiert um die Argumentation zu stützen?

Wir begrüßen deshalb die wachsende Entschlossenheit von Bundesregierung, Landesregierungen und den im Bundestag vertretenen Parteien, die Rechte von Urhebern und Werkmittlern weiter an die Bedingungen des Internets anzupassen.

Aha. Hier haben wie es also,  das Leistungsschutzrecht in Form der Werkmittler.

Wobei ich immer noch nicht verstanden habe wie ein Recht das im wesentlichen die Auswahl / Zusammenstellung von Werken anderer, den Urhebern schützt auf ein Medium dessen wesentliche Leistung es unter anderem ist, die Einzelteile zugänglich zu machen, d.h. den Inhaltezugang auf Artikelebene zu ermöglichen anzuwenden ist.

Die Entschlossenheit der Exekutive wird diesbezüglich tätig zu werden wird entweder auf Basis intensiver Lobbyarbeit erreicht worden sein oder, mindestens genau so wahrscheinlich, proaktiv postuliert.

Die Forderungen lesen sich doch eher so, dass die Bedingungen des Internets ignoriert /angepasst werden sollen,

Im Internet darf es keine rechtsfreien Zonen geben. Gesetzgeber und Regierung auf nationaler wie internationaler Ebene sollten die geistige Wertschöpfung von Urhebern und Werkmittlern besser schützen. Ungenehmigte Nutzung fremden geistigen Eigentums muss verboten bleiben.

Vor zwei Absätzen wurde richtigerweise festgestellt, dass das Internet kein rechtsfreier Raum ist. Zwei Sätze später wird dies noch einmal mit der Feststellung, dass die ungenehmigte Nutzung fremden geistigen Eigentums verboten bleiben muss bestätigt. Also was soll das ganze Gerede vom Internet als rechtsfreien Raum. Ich kann es nicht mehr hören.

Am Ende muss auch im World Wide Web gelten: Keine Demokratie gedeiht ohne unabhängigen Journalismus.

Bei diesem Satz steigt mein Parser aus. Bedroht jetzt das Web den unabhängigen Journalismus oder gar die Demokratie. Welcher Teil des HTTP-Protokolls ist dafür verantwortlich? Gilt ein Satz nicht mehr nur weil im World Wide Web gesagt wird? ???

Kein Wissen entsteht ohne faire Beteiligung an seinem wirtschaftlichen Ertrag.

Das ist nun wirklich der krönende Abschluss. Auf einmal wird aus Inhalten Wissen, das hört sich einfach besser an.

Ich würde mal behaupten: Die meisten (Wissens-)Inhalte, entstehen ohne “faire” Beteiligung der Ersteller  an seinem wirtschaftlichen Erfolg. Zumindest “fair” in dem von den Verlagen gebrauchten Sinne, denn man muss davon ausgehen, dass mit “fair” auf jeden Fall “signifikant” gemeint ist. Aber anscheinend ist man zu verschämt  dieses Wort (oder ein stärkeres) zu gebrauchen.

Das liegt zumeist daran dass die Ersteller von (Wissens-)inhalten andere primäre Ziele als rein wirtschaftliche verfolgen resp. durch diese getrieben sind.

Bem.: Ich habe in einem frühreren Leben mal im Bereich KI und WIssensrepräsentation wissenschaftlich gearbeitet und darüber promoviert. Aus dieser Sicht heraus würde ich dann doch darauf bestehen, das  das Wissen durch das Lesen der Artikel bzw. der Inhalte beim Leser entsteht.

Nehmen wir aber mal an, es ist die Entstehung von Inhalten, resp.  die Repräsentation von Wissen in diesen Inhalten gemeint.

Ich habe jetzt keine Lust in der Historie zu kramen, aber mir fallen im Umfeld  des WWW   sofort einige Beispiele ein, in denen (Wissens-)inhalte entstanden sind, ohne dass die Ersteller

  • Wikipedia und wenn man den Begriff Wissen ernst nimmt, dbpedia und die ganzen Wissensbasen der Linked Data Initiative entstanden ohne dass die überwältigende Mehrheit der Schöpfer dieses Wissens an dem wirtschaftlichen Erfolg  beteiligt sind. Noch schlimmer sie haben damit überhaupt keine Probleme.
  • Gleiches gilt für Openstreetmap,
  • Oder für alle CC-BY, CC-BY-SA und Public Domain Inhalte

Zuguterletzt gilt es auch für alle Open Source Projekte.

Vielleicht sollte die Inhalteindustrie sich mal genau ansehen:

  • wie es die IT-Industrie geschafft hat, dass sie einen grossen Teil ihrer wertvollsten Inhalte erstellt ohne dass es eine faire Beteiligung an dem wirtschaftlichen Erfolg für einen Grossteil der Beteiligten gibt.
  • Wie es sie geschafft hat, wie “Amateurentwickler” und “Qualitätsentwickler” konstruktive zusammenarbeiten bei der Erstellung dieser kostenlosen Inhalte.
  • Und wie sie es geschafft hat auf Basis dieser kostenlosen Inhalte erfolgreiche Geschäftsmodelle zu etablieren.

Zusammenfassung

Anscheinend ist den Verlagen die Hamburger Erklärung wichtig. Daher ist es für mich grob fahrlässig wenn sie in Ihrer Argumentation so lausig ist. Wenn sie keine bessere Argumentation liefern können, dann werden sie nicht auf meine Unterstützung rechnen können.

P.S.: Andere Meinungen zur Hamburger Erklärung

Nachdem ich jetzt auch dazu gemommen bin auch andere Meinungen zur Hamburger Erklärung zu lesen, hier ein zwei Pointer:

P.P.S.: Watermarking

Im Text selbst steht nichts von Watermarking als Lösungsansatz. Daher kurz:

  • Ich kenne keine Verfahren die ein Watermarking von Texten sinnvoll leisten können, dazu steckt in einem Text einfach zu wenig Information (in einem informationstheoreischen Sinne)
  • Auch steganographisch lässt sich daher nix machen.
  • Daher wird bei der Inhalteverfolgung von Texten zumeist ein Fingerprinting-Verfahren auf Basis von Hashfunktionen und sich überlappenden Wort-n-grammen, sogenannten “Shingle’s”  benutzt.
  • Wen es interessiert, der kann sich mal den folgenden Artikel von Google (sic) durchlesen: “Detecting the Origin of Text Segments Efficiently“. Aus der Zusammenfassung: “The strong performance and moderate space requirements of our best algorithm suggest that real-time origin detection on web-scale is possible.”

Update: Musste im hinteren Teil nochmal redigieren, war heute nacht einfach zu spät. Habe dann auch die kurze Watermarking Sektion ergänzt.

Update 2 : Habe es dabei geschafft mir das Layout komplett zu zerschiessen. Ist hoffentlich wieder repariert.

Update 3: Noch zwei Pointer zu anderen Blogeinträgen dazu gepackt

Update 4: Links zu Dietmar Harhoff dazu gepackt.

Written by gkamp

June 10th, 2009 at 12:58 am