A kiadók akadályozzák a tudományos felfedezéseket?
Az adatbányászat módszerével a milliónyi oldalra rúgó tudományos publikációk közül ki tudjuk választani a számunkra relevánsakat. Az adatbányászat módszerét azonban nem használhatjuk szabadon, ugyanis a nagy kiadók adatbázisai nem férhetőek hozzá.
A Manchesteri Egyetem evolúcióbiológusa, Dr. Casey Bergman és Max Haeussler, a Kalifornia Egyetem kutatója kifejlesztették a Text2genome elnevezésű szoftvert. Ez az adatbányászó program képes a tudományos szövegekben azonosítani azokat a betűkombinációkat, amelyek DNS-szekvenciákat, azaz géneket írnak le, és képes kiválogatni az ezekről tett állításokat. Segítségével egy adatbázisból összegyűjthetjük mindazokat a tudományos cikkeket, amelyek ezt a szekvenciát tárgyalják. Az adatbányászó programnak köszönhetően tehát a kutatók egy adott génnel kapcsolatban könnyen és gyorsan megtalálhatják a releváns szakirodalmat... Azaz megtalálnák, de a dolog nem ennyire egyszerű.
A nagyobb tudományos kiadók ugyanis ellehetetlenítik a kutatásokat. A világ legnagyobb kiadói ugyanis – amilyen az Elsevier, a Macmillan vagy a Wiley –, amelyek a világ legtöbb tudományos publikációját kezelik, nem engedélyezik az adatbányászatot, mivel az általuk publikált tartalmak nem szabadon nem hozzáférhetőek. Súlyos pénzeket kell fizetniük a tudósoknak, a kutatóintézeteknek, hogy ezeket az adatbázisokat használni tudják.
Jóllehet az orvostudományi kutatásokban különösen fontos, hogy az interneten gyorsan és könnyen elérhetőek legyenek mindazoknak a kutatásoknak az eredményei, amelyek a világon folynak. Ahhoz, hogy ezeket hatékonyan használni tudják a tudósok, egyszerre kell, hogy hozzáférjenek több tízezer tudományos cikkhez egy adatbázisban.
Mivel évente körülbelül 1,5 millió tudományos publikáció lát napvilágot, az adatok, az eredmények megkettőzésének az esélye igen nagy. Egy-egy kutatótól nem várható el az, hogy ilyen mennyiségű adatot fejben tartson (ugyanis ez képtelenség), ezért lenne igazán nagy szükség a számítógépekre, az adatbányászó szoftverekre.
Különböző új adatbányászati technikákkal eddig még nem ismert mintázatokat fedezhetnének fel, kapcsolatokat kereshetnek milliónyi adat között. Az adatbányászat technikája a 21. században elfogadott kutatási módszernek számít, és egyre inkább elterjedt világszerte. Ezzel a technikával ugyanis olyan összefüggésekre derülhet fény, amelyek mindeddig rejtve maradtak a többezernyi oldalas kutatási anyagokban.
Éppen ezért az utóbbi időben egyre többen az adatok, a cikkek szabad hozzáférhetősége mellett kampányolnak: mindazokat a tudományos eredményeket, amelyek közpénzből lettek finanszírozva, szabadon hozzáférhetővé kell tenni. Ha ez megvalósulna, akkor az adatbányászat is probléma nélkül működhetne.
Forrás
Text mining: what do publishers have against this hi-tech research tool?