[Openstandaarden] De Standaard Online: pdf met DRM

Jan Claeys janc+openstandaarden at lugwv.be
Mon May 16 18:32:01 CEST 2005


Op ma, 16-05-2005 te 17:25 +0200, schreef Peter Vandenabeele:
> Een bedenking die ik met nadien heb gemaakt is dat ik vrees dat een Closed 
> Source programma bovenop Linux toch ook niet werkbaar is ? Zelfs al is 
> dat programma Closed, de output van het programma naar het scherm via
> een open (syscall / glibc) interface laat dan toch nog altijd toe om
> gewoon de originele tekst van het geciteerde artikel te "rippen" en
> gewoon terug in clear tekst te publiceren ? Of misschien zal het 
> programma zelf grafisch in een framebuffer schrijven ... zodat je alweer 
> OCR nodig hebt om het te rippen ?

Datzelfde is gegarandeerd ook mogelijk onder Windows...

Het is volgens mij bijna zeker ook mogelijk om Adobe Reader te scripten
zodat het elk stuk van elke pagina toont, daar telkens automatisch een
screenshot van te maken, dat door OCR te halen en een bijna perfect
plain text resultaat eruit te halen...

Kijk bijvoorbeeld hoe subtitels van DVDs geript worden door de pixelmap
overlays waar deze origineel uit bestaan te OCR'en.

Dat scripten werd overigens al eens gedaan met een andere DRM-techniek
waarbij het mogelijk was om de tekst op één pagina te selecteren en deze
via copy-paste uit een e-book reader te halen...


-- 
Jan Claeys




More information about the Openstandaarden mailing list