Biuletyn Porozumienia 'Biblioteka z Horyzontem
Pierwsza strona
Warto wiedzieć

Mirosława Mocydlarz
Udostępnianie informacji naukowej na nośnikach elektronicznych


Rozdział 4.

Projekt Gutenberg i SuperJournal - znaczenie dla udostępniania elektronicznej informacji naukowej.


W erze rozwoju wydawnictw zajmujących się wydawaniem publikacji elektronicznych, mogło i może zdarzyć się, iż "studenci i naukowcy zrezygnują z pośrednictwa bibliotek i będą kupować informacje bezpośrednio u wydawców. Jeśli tak będzie, to biblioteki staną się wkrótce archiwami lub osiągną obecny status herbariów lub muzeów. Aby się ratować przed tą sytuacją wiele bibliotek przystąpiło do realizacji projektów digitalizacji i udostępniania zasobów oraz rozwoju potrzebnych funkcji w elektronicznym dostępie do informacji. Projekty te były przeprowadzane w ramach programów o zasięgu ogólnoświatowym. Na uwagę zasługują dwa projekty: Projekt Gutenberg, który zapoczątkował udostępnianie pełnych tekstów dokumentów w wersji elektronicznej i projekt SuperJournal, w ramach którego użytkownicy wypowiadali się min. na temat konieczności zastosowania mechanizmów przeglądania i wyszukiwania informacji naukowej na nośnikach elektronicznych.


4.1. Projekt Gutenberg.

Projekt Gutenberg rozpoczął się w 1971 roku kiedy Michael Hart oświadczył, że największą wartością stworzoną przez komputer nie będzie praca na komputerze ale magazynowanie, odzyskanie i wyszukanie tego co było składowane w bibliotekach tradycyjnych. Następnie rozpoczął tworzenie "Deklaracji Niezależności", którą chciał wysłać do każdego w sieci... co dzisiaj może być opisane jako nie tak nieznaczne uchybienie w tworzeniu wczesnej wersji czegoś, co później nazwano "wirusem Internetowym". Odradzanie w tej sprawie przez przyjaciela wydało pierwszą przesyłkę w postaci dokumentu elektronicznego, a Projekt Gutenberg narodził się wtedy, gdy Hart oświadczył, że zarobił 100.000.000$ ponieważ kopia "Deklaracji Niepodległości" może być elektroniczną przynależnością biblioteki skomputeryzowanej z 100.000.000 użytkowników komputerowych w przyszłości. Przesłanka, na której Hart oparł Projekt Gutenberg brzmiała: cokolwiek co może być wprowadzone do komputera może być powielane bez końca (tzw. Technologia Powielania). Technologia zakładała, że raz wprowadzona do komputera książka lub inny dokument (także obrazki, dźwięki) może być powielana i w wielu kopiach dostępna każdemu na świecie. Od tej technologii powstało wiele odgałęzień.
  • elektroniczne teksty stworzone przez Projekt muszą być dostępne w najprostszy, najłatwiejszy sposób do użycia;
  • elektroniczne teksty muszą być tworzone przy użyciu znaków ASCII - tak samo jak w przypadku wersji drukowanych (podkreślenia, kursywa, pogrubienia, itp.).
Przyczyną tego jest, że 99% sprzętu i oprogramowania, które posiadają użytkownicy, jest prawdopodobnie przystosowana do odczytywania i szukania takich plików.
Filozofia Projektu Gutenberg opiera się na następujących wytycznych:
    - uczynić informację, książki i inne materiały dostępne dla "szerokiej publiczności"w formach łatwych do czytania, użytkowania, przeszukiwania dla większości komputerów, programów i ludzi, co pociągnęło implikacje:
    1. elektroniczne materiały powinny kosztować tak mało, aby nikt nie zdawał sobie naprawdę sprawy jak wiele one kosztują; powinny być ogólnego rozmiaru aby zawsze pasowały do sprzętu dostępnego na rynku;
    2. elektroniczne materiały powinny być tak proste w użyciu, aby nikt nigdy nie musiał zatroszczyć się o to jak je używać, czytać, przeszukiwać;
Implikacja 1.
Początkowo w "Deklaracji Niezależności" pozwalała na zamieszczanie elektronicznych dokumentów o wielkości 5 K (1971 r.). Później jednak rozpoczęto pracę nad udostępnieniem w sieci Konstytucji USA oraz Biblii a jeszcze później Shakespeare. Projekt zyskiwał co raz większą sławę a standardową wielkość powiększono do 360K i dlatego można było stworzyć wersję elektroniczną "Alicji w Krainie Czarów" czy "Piotrusia Pana", ponieważ mogły się one zmieścić na jednym dysku. Obecnie 1.44 MB jest standardem a ZIP jest standardem kompresji; praktyczny rozmiar pliku wynosi około trzy miliony znaków, czyli znacznie więcej aniżeli dla każdej przeciętnej książki.

Implikacja 2.
Teksty elektroniczne powinny być prezentowane w oparciu o znaki ASCII z tej przyczyny, że jest to jedyny tryb tekstowy, który jest prosty i łatwy zarówno dla oka jak i dla komputera. Możliwe jest stosowanie pogrubienia, kursywy, i pisma pochylonego a teksty elektroniczne mogą być dostępne i odczytywane zarówno na komputerze Amiga, Apple, Atari do IBM, do Mac'a, itp. Elektroniczne teksty Projektu Gutenberg mogą być zarówno dostępne w sieci lokalnej jak i rozległej, mogą być przesyłane za pomocą FTP czy poczty elektronicznej. Dzięki tak prostym założeniom elektroniczne teksty będą dostępne tak długo jak trwa cywilizacja a programy, systemy operacyjne nieustannie zmieniane i ulepszane nie przetrwają rewolucji technologicznej.
W Projekcie Gutenberg nie wszystkie jednak teksty mogą być udostępniane w formie elektronicznej. Istnieją bowiem trzy kategorie:
  • literatura lekka, jak: "Alicja w Krainie Czarów", "Piotruś Pan", itp.;
  • literatura ciężka, jak: Biblia i inne dokumenty religijne, Shakespeare, itp.;
  • bibliografie, encyklopedie, słowniki, itp.
Projekt Gutenberg jest pierwowzorem w digitalizacji a następnie udostępnianiu pełnotekstowych dokumentów w formie elektronicznej. Od niego wszystko się zaczęło. Dlatego też należało by przy próbach udostępniania informacji naukowej na nośnikach elektronicznych pójść za jego przykładem i na pierwszym miejscu stawiać nie wygląd, oprawę graficzną dokumentu czy wymagania sprzętowe, mimo że jest to sprawą ważną, ale przede wszystkim na jakość i treść proponowanych dokumentów dostępnych w sieci. Trzeba jednak zaznaczyć, że nie zależy to tylko od wydawców czy bibliotek ale także od producentów sprzętu i oprogramowania, którzy wszelkimi siłami dążą do osiągnięcia upragnionego maksimum wprowadzając co pół roku nowy model. Powoduje to, przede wszystkim rosnące wydatki bibliotek, które nie mogą, nawet jeżeli by chciały, zastosować sprzętu i oprogramowania o wymaganych parametrach a jedynie o parametrach narzuconych przez producenta.


4.2. Projekt SuperJournal.

SuperJournal to projekt trzyletni przeprowadzony w latach 1996 - 1998 w ramach programu Electronic Libraries (UK eLib) na terenie Wielkiej Brytanii fundowany przez JISC. W czasie trwania projektu długotrwałą czynnością było wyszukanie i zatwierdzenie miejsc, gdzie rozwijały się usługi elektronicznych magazynów, gdzie użycie projektu mogło by być nadzorowane i gdzie opinie użytkowników zbierane a rezultaty wykorzystane do dalszego rozwoju usług. Do programu weszło 49 naukowych magazynów, które podzielono na cztery główne kategorie: Komunikacja i Studia Kulturalne (CCS), Genetyka Molekularna i Proteiny (MGP), Nauki Polityczne (PS) i materiały Chemiczne (MC). Manchaster Computing otrzymał dane dla tych magazynów od wydawców pracujących razem nad zgłębianiem przyszłości elektronicznych magazynów (trzynastu wydawców, min. Blackwell Publishers, Cambridge University Press, Springer Verlag, Oxford University Press i inne) i dostarczył je użytkownikom w bibliotekach tych trzynastu uczestniczących stron. Zbieraniem i analizą danych zajął się zespół oceniający z Loughbourgh University, który również przeprowadzał "badania" użytkowników (pracownicy nauk społecznych, pracownicy naukowi, studenci, bibliotekarze, itp.) w wywiadach, grupach "focus" 49 i kwestionariuszach. Implementacja funkcji projektu była oparta o żądania użytkowników i doświadczenia z poprzednich projektów elektronicznych magazynów. Było możliwe więc zawarcie wszystkich możliwych funkcji i nastawienie projektu na dostarczenie funkcji, które były wymagane przez dużą liczbę użytkowników, z którymi przeprowadzono wywiad i tych, które były w interesie usług inwestorów. Tabela 1. pokazuje wynikowe cechy i funkcje (na temat, których zbierane były zarówno dane jak i opinie użytkowników) projektu SuperJournal w seriach w kolejności udostępnienia, które oznaczają, że SuperJournal zawierał większość z funkcji, które są nadal rozwijane.


Tabela 1. Wynikowe cechy i funkcje elektronicznych magazynów w projekcie SuperJournal.

Wydanie

Cechy

Wydanie 1

(Listopad 1996)

    • Dostęp na podstawie hasła;
    • Przeglądanie:
    • przeglądanie zawartości magazynów;
    • pełnotekstowe artykuły wyświetlane w formacie PDF;
    • Wyszukiwanie:
    • oparte o nagłówki artykułów i abstrakty;
    • oparte o nazwisko autora i słowa kluczowe;
    • oparte na dwóch mechanizmach wyszukiwania;
    • Połączenia - linki z artykułami lub z zewnętrznymi URL-ami;

Wydanie 2

(Maj 1997)

    • Przeglądanie:
    • "mini-zawartości": przeglądanie tytułów, sekcji nagłówków, obrazków (dla magazynów w grupie MGP, tylko w formacie HTML);
    • artykuły mogą być wyświetlane w formacie HTML i PDF, wtedy gdy dostawcy dostarczają PDF + dodatkowo HTML lub SGML;
    • Wyszukiwanie:
    • pełnotekstowe artykuły są w pełni przeszukiwalne;
    • oparte na trzech mechanizmach wyszukiwania;
    • oparte o naturalny język;
    • Połączenia - linki - ze wzmianek bibliograficznych do abstraktów w bazach pełnych tekstów (tylko w formacie HTML);

Wydanie 3

(Kwiecień 1998)

    • stworzenie osobistej listy artykułów, którą w przyszłości należy udostępnić;
    • linki z abstraktów do listy odniesień bibliograficznych ( tylko format HTML);
    • zachowanie odniesień do artykułów na ekranie lub przez e-mail w standardowych formatach;
    • zachowanie listy odniesień bibliograficznych na koniec artykułu na ekranie monitora lub przez e-mail w standardowych formatach;
    • zachowanie wyników wyszukiwania za pomocą NetAnswer w standardowych formatach;

Wydanie 4

(Sierpień 1998)

    • strony uczestniczące mogą budować linki do magazynów;
    • usługa alarmowania oparta o profil osobisty (użytkownicy wyznaczają istotne słowa i zwroty);
    • linki z odnośników bibliograficznych do abstraktów, dla artykułów w formacie PDF;

W projekcie SuperJournal określono potencjalne funkcje i cechy ważne dla elektronicznych magazynów. Do podstawowych zaliczono: wyszukiwanie, przeglądanie i wyświetlanie, które według twórców są elementami niezbędnymi przy udostępnianiu materiałów w wersji elektronicznej. Na podstawie zebranych danych z ośrodków uczestniczących w projekcie oraz wywiadu z użytkownikami oceniono przydatność i rolę jaką dane funkcje pełnią w elektronicznej bibliotece zwłaszcza przy udostępnianiu pełnotekstowych baz danych.
Przeglądanie było zdefiniowane jako jakakolwiek forma dostarczania informacji. Forma ta wspierana była przez dwa typy interakcji użytkownika z systemem: kiedy użytkownik nie miał określonej strategii wyszukiwania i kiedy użytkownik dokładnie wiedział czego szuka ale w celu wyboru potrzebnej informacji dostawał się do niej za pomocą połączeń hipertekstowych zaimplementowanych w systemie o podstawowej strukturze, która replikowała hierarchiczną strukturę literatury magazynów, tj. przedmiot, lista magazynów, lista kwestii, tabela zawartości, abstrakt i artykuł. Linki te umożliwiały poruszanie się z wyższych poziomów do niższych, na każdym poziomie były możliwe: przeniesienia w górę, w dół, do poprzedniego i następnego poziomu lub cofnięcia opcji. To tzw. podstawowe wyszukiwanie podzielono na trzy grupy (łańcuchowe przeglądanie pionowe, skokowe przeglądanie pionowe, poziome przeglądanie). W projekcie używano także połączenia hipertekstowe, które znajdowały się w nagłówkach, tekście artykułu lub jako zakładki stworzone przez samych użytkowników. Linki pozwalały na przeniesienie do określonej sekcji artykułu.
Wyszukiwanie oznaczało akcję dostarczenia informacji przy użyciu jednego z trzech mechanizmów: Isite, NetAnswer (przejście do tabeli zawartości lub wyprowadzenie rezultatów wyszukania) lub Retrieval Ware, zbudowanych do stworzenia wszechstronnie przeszukiwalnego środowiska oraz w celu porównania różnych urządzeń wyszukiwania. Dodatkowo pozwolono na wyszukanie w oparciu o słowa kluczowe łączone operatorami Boolowskimi a także poprzez nazwę autora i kluczowe indeksy (Isite). Kiedy zapytanie wyszukania było spełnione użytkownik mógł przeglądnąć abstrakt lub pełny tekst artykułu.
Funkcje użytkownika to te funkcje, które pozwalały zakładać ich własny preferowany system cech a predefiniowanej listy opcji (dowolny mechanizm wyszukiwania, dowolna kategoria magazynów, zmiana e-mail, zmiana identyfikatora osobistego i inne) lub stworzyć nową ścieżkę w nawigacji przez zakładkę.
Kolejną grupą, której przydatność sprawdzano była grupa funkcji obejmujących: alarmowanie (alarm za pomocą e-mail, osobisty alarm), zachowywanie (dane bibliograficzne, sekcja artykułu, znalezione pozycje), komunikacja (wysyłanie e-mail do zespołu do Manchester Computing, do autorów artykułów, uczestnictwo w otwartych dyskusjach) i linki (nawigacja między abstraktami i opisami w bazie).
W przeprowadzonych badaniach i wywiadach z użytkownikami stwierdzono:
- przeglądanie - funkcja najbardziej popularna i najczęściej używana (99% sesji) do znalezienia informacji użytkowników różnych dyscyplin i o różnych statusach. Główną metodą w przeglądaniu było podstawowe przeglądanie przechodząc od wyższego do niższego poziomu w hierarchicznej strukturze magazynu (83,80% sesji). Do przeglądania pełnotekstowych dokumentów wykorzystywano przeważnie metody poziomego, pionowego i skokowe przeglądania. Użytkownicy (100%) spostrzegali tę metodę jako prostą w przeglądaniu takiej ilości artykułów (głównie pełnotekstowych) i dającą szerokie możliwości dotarcia do wcześniej nieznanych artykułów;
- wyszukiwanie - funkcja (Isite - 612 sesji, NetAnswer - 510 sesji, RetrievalWare - 94 sesje) użyta przez 26% użytkowników w 12% całkowitej liczby sesji. Funkcję tę wykorzystywali przede wszystkim pracownicy naukowi i studenci. Użytkownicy (około 50%) określili ją jako "miło, że jest" lub "nieważna" w odniesieniu do pełnych tekstów artykułów.
- drukowanie - po wyszukaniu użytkownicy mogli wyświetlić lub wydrukować artykuł, analizowane były jednak dane dotyczące wyświetlania w formatach PDF lub HTML. Z wywiadów przeprowadzonych z użytkownikami wynikało, że użytkownicy preferują do wyświetlania format HTML a do wydruku PDF. Ponadto z danych wynikało, iż częściej był używany format PDF, co z kolei oznaczało, że po znalezieniu artykułu użytkownicy preferują otrzymanie go w wersji drukowanej (około 90% użytkowników) aniżeli wyświetlanej na ekranie monitora;
- funkcje użytkownika - używane w 532 sesjach przede wszystkim do zmiany praw (2,1%), zmiany listy artykułów (w 160 sesjach pozycje dodane do listy a w 23 sesjach pozycje zostały usunięte). 80% użytkowników uważa, że metoda nie musi być wykorzystana w udostępnianiu elektronicznych magazynów.
- alarmowanie (16% sesji), zachowywanie (18% całkowitej liczby sesji), komunikacja i linki (1,9% sesji SuperJournal). Użytkownicy (56%) uważa, że alarmy nie powinny być funkcjami elektronicznych magazynów.
Z badań przeprowadzonych w ramach projektu wynika, że powyższe funkcje mają bardzo różne znaczenie dla użytkowników. Jednak zdecydowana większość uważa, że przeglądanie wraz wyprowadzaniem wyników (drukarka/ekran) są najważniejszymi własnościami a dopiero później pozostałe funkcje. Dla użytkowników nauk społecznych większe znaczenie mają udostępnione mechanizmy wyszukiwania aniżeli dla pracowników nauki; studenci podobnie używają ich rzadziej niż personel biblioteki. Większe użycie mechanizmów wyszukiwania wynikało z częstszego ich używania. Funkcje użytkownika, które mogły być zmienione nie odegrały istotnej roli w projekcie. Wynikało to najprawdopodobniej z tego, iż dla użytkowników ważniejsze są udostępniane informacje, możliwość wyszukania interesujących artykułów i ich jakość aniżeli manipulacja prawami dostępu. 90% użytkowników, którzy opowiedzieli się za wydrukiem rezultatów wyszukania, uzmysławia, że w nadal na arenie elektronicznych informacji ważne będzie wykorzystanie papieru. Pozostałe funkcje: alarmy, komunikowanie mogą być uznane za funkcje dodatkowe do wykorzystania w elektronicznych magazynach.


Początek strony   |   Spis treści   |   Poprzednia strona   |   Następna strona