0:05
Főoldal | Rénhírek

A kiadók akadályozzák a tudományos felfedezéseket?

Az adatbányászat módszerével a milliónyi oldalra rúgó tudományos publikációk közül ki tudjuk választani a számunkra relevánsakat. Az adatbányászat módszerét azonban nem használhatjuk szabadon, ugyanis a nagy kiadók adatbázisai nem férhetőek hozzá.

nyest.hu | 2012. május 25.

A Manchesteri Egyetem evolúcióbiológusa, Dr. Casey Bergman és Max Haeussler, a Kalifornia Egyetem kutatója kifejlesztették a Text2genome elnevezésű szoftvert. Ez az adatbányászó program képes a tudományos szövegekben azonosítani azokat a betűkombinációkat, amelyek DNS-szekvenciákat, azaz géneket írnak le, és képes kiválogatni az ezekről tett állításokat. Segítségével egy adatbázisból összegyűjthetjük mindazokat a tudományos cikkeket, amelyek ezt a szekvenciát tárgyalják. Az adatbányászó programnak köszönhetően tehát a kutatók egy adott génnel kapcsolatban könnyen és gyorsan megtalálhatják a releváns szakirodalmat... Azaz megtalálnák, de a dolog nem ennyire egyszerű.

A nagyobb tudományos kiadók ugyanis ellehetetlenítik a kutatásokat. A világ legnagyobb kiadói ugyanis – amilyen az Elsevier, a Macmillan vagy a Wiley –, amelyek a világ legtöbb tudományos publikációját kezelik, nem engedélyezik az adatbányászatot, mivel az általuk publikált tartalmak nem szabadon nem hozzáférhetőek. Súlyos pénzeket kell fizetniük a tudósoknak, a kutatóintézeteknek, hogy ezeket az adatbázisokat használni tudják.

Jóllehet az orvostudományi kutatásokban különösen fontos, hogy az interneten gyorsan és könnyen elérhetőek legyenek mindazoknak a kutatásoknak az eredményei, amelyek a világon folynak. Ahhoz, hogy ezeket hatékonyan használni tudják a tudósok, egyszerre kell, hogy hozzáférjenek több tízezer tudományos cikkhez egy adatbázisban.

Mivel évente körülbelül 1,5 millió tudományos publikáció lát napvilágot, az adatok, az eredmények megkettőzésének az esélye igen nagy.  Egy-egy kutatótól nem várható el az, hogy ilyen mennyiségű adatot fejben tartson (ugyanis ez képtelenség), ezért lenne igazán nagy szükség a számítógépekre, az adatbányászó szoftverekre.

DNS
DNS
(Forrás: Wikimedia Commons)

Különböző új adatbányászati technikákkal eddig még nem ismert mintázatokat fedezhetnének fel, kapcsolatokat kereshetnek milliónyi adat között. Az adatbányászat technikája a 21. században elfogadott kutatási módszernek számít, és egyre inkább elterjedt világszerte.  Ezzel a technikával ugyanis olyan összefüggésekre derülhet fény, amelyek mindeddig rejtve maradtak a többezernyi oldalas kutatási anyagokban.

Éppen ezért az utóbbi időben egyre többen az adatok, a cikkek szabad hozzáférhetősége mellett kampányolnak: mindazokat a tudományos eredményeket, amelyek közpénzből lettek finanszírozva, szabadon hozzáférhetővé kell tenni. Ha ez megvalósulna, akkor az adatbányászat is probléma nélkül működhetne.

Forrás

Text mining: what do publishers have against this hi-tech research tool?

Kapcsolódó tartalmak:

Hasonló tartalmak:

Hozzászólások:

Követem a cikkhozzászólásokat (RSS)
Még nincs hozzászólás, legyen Ön az első!