Sprawozdanie z debaty „W stronę polityki otwartych danych” 5 grudnia 2013

Home / Aktualności / Sprawozdanie z debaty „W stronę polityki otwartych danych” 5 grudnia 2013

Sprawozdanie z debaty „W stronę polityki otwartych danych” 5 grudnia 2013

Obywatele Nauki razem z Instytutem Systemów oraz Centrum Cyfrowym
zorganizowali debatę poświęconą kwestii otwartych danych.
Korzystaliśmy z uprzejmości Fundacji Projekt:Polska, która użyczyła
nam swoja salę seminaryjną na to wydarzenie. W debacie udział wzięli
dr Alek Tarkowski z Centrum Cyfrowego, Arek Gładki z Zakładu
Bioinformatyki Instytutu Biochemii i Biofizyki PAN oraz Marcin
Wojnarski, reprezentujący firmy Wall of Sports i TunedIT. Debatę
prowadził dr Paweł Szczęsny z Instytut Systemów oraz IBB PAN.

Punktem wyjścia do debaty o otwartych danych był raport firmy McKinsey
z 2010 roku dotyczący wpływu umożliwienia maszynowej analizy danych i
tekstów, których pozyskanie lub stworzenie zostało sfinansowane ze
środków publicznych. W raporcie oszacowano, że taka decyzja
stworzyłaby rynek usług o wartości ok. 100 miliardów euro rocznie.

Marcin Wojnarski zwracał uwagę na to, że otwartość  danych jest
fundamentalna dla współczesnej nauki, natomiast dużo mniejsza liczba
uczonych to faktycznie robi, w stosunku do tych, którzy o tym mówią.
Ponadto podkreślał, że mamy do czynienia ze zmianą paradygmatu –
gospodarka oparta na wiedzy 20 lat temu była głównie oparta na
tworzeniu nowej wiedzy, podczas gdy w tej chwili gospodarka coraz
bardziej opiera się na wtórnym wykorzystaniu wiedzy. Bariery w
dostępie do informacji, nie tylko spowalniają rozwój nauki, ale także
rozwój gospodarki.

Arek Gładki opisywał obecny status text-miningu w odniesieniu do
literatury naukowej. Zwrócił uwagę m.in. na to, że w przypadku
literatury biomedycznej na ok. 22 mln wszystkich publikacji naukowych
dostępnych do czytania jest ok. 3 mln (także w modelu OA), natomiast
tylko 500 tys. jest dostępnych na warunkach, które umożliwiają
automatyczne przetwarzanie. Pokazywał też wyniki badań wskazujących na
to, że text-mining oparty o pełne teksty artykułów pozwala na
zidentyfikowanie o rząd wielkości więcej relacji, niż analiza samych
abstraktów. Na koniec swojej wypowiedzi, podobnie jak Marcin
Wojnarski, zwrócił uwagę na małe zainteresowanie analizą pełnych
tekstów przez naukowców, co oznacza stosunkowo mały nacisk na
wydawców.

Alek Tarkowski zwrócił uwagę na pewien dysonans pomiędzy dyskusją o
otwartych danych, a dyskusją o otwartości literatury naukowej. Ta
druga wydaje się cichnąć, mimo tego, że w Polsce problem Open Access
nie jest wciąż w systemowy sposób rozwiązany. Ponadto, zauważył, że
środowiska zainteresowane otwartością danych naukowych nie rozmawiają
ze środowiskami zainteresowanymi otwartością danych publicznych. W
konsekwencji dochodzi do sytuacji, w której obecna dyskusja wokół
otwartości danych dotyczy bardziej rozciągnięcia istniejących praw
dostępu tak, aby obejmowały one też text- i data-mining. Natomiast
coraz mniej dotyczy ona samej kwestii otwartego do nich dostępu.
Podkreślił też, że dane są bardzo specyficzne, jeśli chodzi o kwestie
prawne. Agregacja danych z wielu źródeł często jest niemożliwa, ze
względu na niekompatybilność warunków licencji, na których zostały
udostępnione.

W dyskusji po wystąpieniach prelegentów zwracano uwagę na to, że
postęp w kwestii otwartości danych administracji publicznej jest
ogromny. Ponadto zwracano uwagę, na kwestie wrażliwości danych –
dostęp do informacji na dużą skalę pozwala na skorelowanie danych
pozornie zanonimizowanych z danymi osobowymi. Wnioskiem końcowym było
m.in. to, że receptą na brak zapału środowiska mogą być regulacje po
stronie grantodawców i instytucji administracji publicznej.

Nagranie z debaty dostępne jest pod adresem (link).

Contact Us

We're not around right now. But you can send us an email and we'll get back to you, asap.