Diskussion:Doubletten finden

Aus UUGRN
Version vom 13. Mai 2009, 15:25 Uhr von Rabe (Diskussion | Beiträge) (worum es *eigentlich* geht, ist ...)

Via http://brad.livejournal.com/2277494.html habe ich noch audmd5 gefunden, das auch dann noch funktioniert, wenn von zwei Kopien derselben Datei die eine andere IDv1/2-Tags hat als die andere. Hier ist man also nicht darauf angewiesen, dass die zu findenden Dubletten binäridentisch sind. --Dagobart 21:58, 20. Mär. 2009 (UTC)

Kollisions Sicherheit

Wie sieht es mit kollionssicherheit aus? Man sollte definitive noch ein cmp laufen lassen um wirklich fest zu stellen ob es sich nicht um Kollisionen handelt. wenn man hierzu auch cmp benutzt haelst sich ggf. ein nicht cryptographiches verfahren benutzen das wesentlich schneller summen berechnen kann. --ph3-der-loewe 14:47, 10. Mai 2009 (UTC)

Das ganze lässt sich auch ohne weiteres mit einem anderen Hashverfahren realisieren, z.B. sha256.
Der *Punkt* an diesem Artikel ist die Art und Weise, mit der man diese Doublettensuche grundsätzlich auf Flatfiles ausführen kann, d.h. die praktische Anwendung von Unix-Standardtools.
Kollisionen halte ich darüber hinaus für unwahrscheinlich, selbst bei md5, denn es gibt keinen "Angriffsvektor" auf das System. md5() wird hier einfach nur als Hilfskomponente angesehen, nicht als Sicherheitskomponente, weil Security hier keine Rolle spielt. Und entsprechend ist auch Paranoia wenig angebracht.
--rabe 15:25, 13. Mai 2009 (UTC)