archívum téma szerint: “pdf”

Gmail-hírek: jobb PDF-kezelés és Twitter

| kategória: etc | téma: , , |

Az egyik Gmaillel kapcsolatos örömhír az, hogy integrálták a Google PDF-olvasóját a rendszerbe, így mostantól a HTML-ként való (kép nélküli, és sokszor egyéb módon is problémás) megjelenítés helyett ebben is nézegethetjük. Zoomolni is tudunk, és a fájlban keresni is – igaz, az utóbbit csak az első 100 oldalon belül.

A másik újdonságnak hivatalosan nincsen köze a Gmailhez, viszont hasznos is, jónak is tűnik. A TwitterGadget egy beépülő Twitter-alkalmazás, melynek frissítése 3 és 30 perc között állítható, vagy akár manuálisan is intézhető.

A működtetéséhez először a Labs-on belül az Add any gadget by URL-t kell engedélyezzük, majd a Settings/Gadget-ben a megfelelő helyre (nem túl sok lehetséges van) bemásolni azt, hogy http://www.twittergadget.com/gadget_gmail.xml.

A TwitterGadget előnye, hogy kis helyen elfér, de számomra éppen ez bizonyult a hátrányának is. Bár erősíthetjük vele a Gmail all-in-one szerepét, de nálam ez volt az a pont, ahol bebizonyosodott, hogy egy nagyobb átrendezés nélkül a Gmail jelenlegi felülete nem alkalmas erre. Oké, hogy olvashatom a maileket, ráadásul ott a chat meg a Twitter is, de ez így (és ekkorában) nekem már túl sok, mert az e-maileken kívüli dolgokra jutó hely túl kevés.

A Google még több PDF-ben keres

| kategória: web | téma: , , |

A Google keresője eddig 315 millió .pdf kiterjesztésű fájlt indexelt be. Ezek egy jelentős része olyan dokumentum, melyet készítője képként szkennelte be, tehát a szó legközvetlenebb értelmében véve szövegkép. Ebben eddig nem keresett a Google. Ennek most vége.

Az optikai karakterfelismerés (rövidítve OCR az angol optical character recognition szavakból) egy olyan módszer, mely lehetővé teszik a fizikai hordozón (leggyakrabban papíron) szereplő analóg írás, szöveg digitális formába történő alakítását. Az átalakított szöveg ezután könnyen használható, feldolgozható számítógépes környezetben.

Mivel itt már részben feldolgozott (beszkennelt) dokumentumokról van szó, ezért nem a klasszikus metódust, hanem annak egy kifejezetten ilyen célra – a Google által finanszírozott – változatát, az OCRopus nevű nyílt forráskódú szoftvert használják.

A “miért jó ez nekem?” kérdésre pedig az a válasz, hogy egyre több – milliónyi – PDF lesz még pontosabban kereshető.

Békéscsaba, szitáló eső – Frankfurt, ragyogó napfény. De a Google keresője egyre csak okosabb.