Přejímání záznamů
JIB a Z39.50 problematika
http://info.jib.cz/informace-pro-knihovny/prebirani-zaznamu/
SKUPINY ZDROJů NA JIB
http://info.jib.cz/informace-pro-knihovny/prebirani-zaznamu/prebirani/
PRIHLASKA PROFILU:
http://info.jib.cz/informace-pro-knihovny/prebirani-zaznamu/prebirani-popis/
http://www.konjunktura.cz/index.php3?w=art&id=2408&rub=376&s=
dva články - úvod do problematiky:
(zkráceno, zvětšeno)
http://info.jib.cz/pro-knihovny/prebirani-zaznamu/prebirani-zaznamu-prostrednictvim-jib/
(zkráceno, zvětšeno)
Přebírání záznamů prostřednictvím JIB
Účelem této funkce je umožnit českým knihovnám stahovat z prostředí svých automatizovaných knihovních systémů bibliografické záznamy od ostatních knihoven.
Při akvizici a především katalogizaci tak katalogizátoři nemusí zbytečně znovu vytvářet záznamy, které jsou již v ostatních knihovnách vytvořeny. Cílem je tedy šetřit limitované finanční i lidské zdroje českých knihoven. Vyhledávání využívá profily (profil = samostatný Z39.50 cíl), které představují sekvenční seznamy zdrojů (mohou obsahovat jakékoli volné prohledatelné zdroje konfigurované v JIB připojené prostřednictvím Z39.50). Profily jsou definovány podle potřeb jednotlivých uživatelů. Dotaz je pak postupně rozesílán jednotlivým zdrojům v seznamu v daném pořadí. Pokud jsou nalezeny záznamy již v prvním zdroji, vyhledávání dále nepokračuje. V opačném případě vyhledávání pokračuje dál. Pořadí zdrojů by mělo být dáno jejich důležitostí. Pro každou knihovnu můžeme vytvořit více profilů, aby např. odrážely specifické potřeby jednotlivých oddělení.
Čas, po který se záznamy vyhledávají, je dán hlavně rychlostí vzdálené databáze a také počtem záznamů, které se na dotaz vrátí. Pokud stahujeme záznamy například z Library of Congress, musíme brát na vědomí, že tato databáze je po celý den značně zatížená (jde o velmi oblíbenou a celosvětově využívanou databázi) a to zvlášť v době od 14 do 18 hodin (díky časovému posunu). Pokud chceme, aby se na náš dotaz vrátily záznamy co nejrychleji, musíme zadávat přesné dotazy - pokud má dokument ISBN (či jiný identifikátor), vyhledáváme zásadně podle něj a a dotaz nekombinujeme s žádnými dalšími poli. V ostatních případech jsou vhodné kombinace polí autor, název, rok. To je zvlášť důležité při stahování záznamů s konverzí. Pokud zadáme obecný dotaz, bude delší dobu trvat, než se záznamy ze vzdálené databáze stáhnou, a ještě delší dobu, než se zkonvertují.
Konverze stažených záznamů
Bibliografické záznamy, o které mohou mít české knihovny zájem, se vyskytují ve vzdálených bibliografických zdrojích v různých formátech (např. UNIMARC, MARC 21) a v různých znakových sadách (UTF-8, CP 1250, CP 852, ISO 8859-2). Bez konverzí formátů a znakových sad by knihovny byly ochuzeny o řadu zdrojů, protože by je nemohly využít. Z toho důvodu byl modul stahování záznamů doplněn o další funkci zajišťující tyto konverze v reálném čase. V českém prostředí, kde v současné době dochází k postupnému přechodu od UNIMARC k MARC 21, je důležitá oboustranná konverze mezi těmito formáty. Konverzi zajišťuje speciální konvertor vyvinutý společností Multidata Praha, naplněný konverzními pravidly Národní knihovny ČR. Možná je oboustranná konverze bibliografických i autoritních záznamů.
Je nutné si uvědomit, že ne všechny bibliografické zdroje nabízejí záznamy stejné kvality. Mnoho záznamů se odchyluje od standardu UNIMARC, což se samozřejmě projeví při práci konvertoru. Zvláště důležité je proto pečlivě zvážit, jaké zdroje začlenit do svého profilu pro stahování. Knihovny by měly volit takové zdroje, které nejlépe odpovídají jejich kvalitě záznamů a se kterými mají dobré zkušenosti. Nabídka zdrojů je široká a budeme se snažit, aby se nadále rozšiřovala.
Co pro využití potřebujete
Základním předpokladem využití funkce stahování záznamů je klient Z39.50 (nemusí mít funkci Update), nejlépe integrovaný do knihovního systému, ve kterém katalogizujete. Pomocí formuláře vyplníte žádost o vytvoření profilu na stahování záznamů. V žádosti uvedete, o jaké zdroje máte zájem a v jakém pořadí je chcete procházet. Na základě žádosti pro vás profily vytvoříme a zašleme vám informace o připojení.
Přebírání záznamů pomocí Jednotné informační brány |
||||||||||||||||||||||||||||
Datum: 20.06.2005
|
Autor: Martin Ledínský
|
|||||||||||||||||||||||||||
Jednotná informační brána nabízí českým knihovnám zdarma službu, která umožňuje přebírání bibliografických a autoritních záznamů z mnoha knihovních katalogů přímo do prostředí automatizovaného knihovního systému, nezávisle na WWW rozhraní JIB.
Sdílená katalogizace a přebírání záznamů
Přebírání záznamů můžeme chápat jako jeden ze způsobů sdílené katalogizace. Nicméně sdílená katalogizace je myšlena různě a může jít o několik odlišných činností. Jejím nejefektivnějším způsobem je katalogizace do společné bibliografické báze. Tedy, několik různých knihoven sdílí a přispívá do jediné bibliografické báze. Tento způsob sdílené katalogizace má množství různých úskalí, zejména technických (heterogenní prostředí automatizovaných knihovních systémů, různá rozhraní, rozdílná implementace standardů) a organizačních (různé pohledy na úroveň katalogizace, problém domluvy), v praxi je proto často využíván jiný způsob - přebírání záznamů (z anglického termínu copy cataloging) nebo také stahování či přejímání záznamů. Každá zúčastněná knihovna zde katalogizuje přímo ve své bibliografické bázi a záznamy cizích knihoven do této báze pouze přejímá. Otázku, proč přebírat záznamy místo tvorby vlastních originálních, hned zodpovím a uvedu příklad České republiky. V ČR má většina knihoven s univerzálním profilem do značné míry podobný knihovní fond. Denně desítky či možná stovky knihovníků po celé zemi zpracovávají dokumenty, které jsou často již zpracovány jinou knihovnou. Dělají tedy množství zbytečné práce, protože bibliografický záznam je možné převzít, upravit jen nezbytnou část a ušetřit tak množství času a námahy. Úspěšnost přebírání u starších dokumentů (např. proces rekatalogizace nebo retrokonverze) je vysoká, úspěšnost přebírání u nových dokumentů rovněž. Je ale nutno poznamenat, že se stává, že dokument ještě zpracován není - zde není samozřejmě na místě dokument odložit a čekat, až ho zpracuje někdo jiný a bude možné ho převzít, nýbrž je nutné dokument zpracovat a těšit se z prvenství (úspěšnost přebírání bibliografických záznamů nových dokumentů je nižší u souborných katalogů aktualizovaných dávkově; dokument mívá často rychleji zpracovaný malá knihovna než velká instituce). Přebírání záznamů nenahrazuje práci katalogizátora, ale usnadňuje ji. Šetří čas, který je možno věnovat jiným pracovním činnostem. Tím dochází k úsporám finančních prostředků v rozpočtech knihoven.
Historie přebírání záznamů pomocí JIB
Přebírání záznamů pomocí Jednotné informační brány (http://www.jib.cz) je k dispozici již od druhé poloviny roku 2002. V té době bylo možné přebírat záznamy pouze v originálních formátech záznamů bez možnosti konverze. Nabídka tak byla ochuzena o řadu kvalitních zahraničních zdrojů. S blížícím se přechodem na formát MARC21 v České republice bylo třeba tento problém (do té doby z nabídky vylučující pouze zahraniční zdroje) řešit. Proto byl modul pro přebírání doplněn některými novými funkcemi a rozšířen o speciální konvertor (MarcMan společnosti Multidata, s. r. o.). Ten byl naplněn konverzními pravidly (formulovanými a implementovanými pro Národní knihovnu České republiky) pro převod bibliografických a autoritních záznamů mezi formáty UNIMARC a MARC21. Konvertor i konverzní pravidla jsou pravidelně aktualizována a v JIB jsou instalovány nové verze. Modifikovaná služba přebírání záznamů byla spuštěna v březnu 2004. Od té doby ji využívá více než 50 knihoven z České republiky.
Představení služby
Díky JIB může kterákoli knihovna v České republice zdarma přebírat záznamy z rozsáhlé nabídky tuzemských i zahraničních zdrojů JIB. Přebírat je možné nezávisle na formátu záznamů, konverze je však na straně JIB zajišťována jen mezi formáty UNIMARC a MARC21. U těchto formátů probíhá konverze v reálném čase a uživatel dostává do svých knihovních katalogů záznamy již zkonvertované. Přitom nezáleží na tom, který automatizovaný knihovní systém (dále jen AKS) používáte. Vyhledávání a výměna záznamů probíhá prostřednictvím protokolu Z39.50. Na straně knihovny, která chce službu využívat, je nezbytné použití Z39.50 klienta, který je většinou integrován v AKS, případně lze využít externího Z39.50 klienta. Pokud si nejste jisti, zda váš AKS disponuje Z39.50 klientem, kontaktujte vašeho dodavatele, který vám tento dotaz rád zodpoví.
Poznámka ke konverzi mezi UNIMARC a MARC 21 - ne všechny zdroje bibliografických záznamů nabízejí záznamy stejné kvality. Mnoho záznamů se odchyluje od standardu MARC, což se samozřejmě projeví i při práci konvertoru (pokud byl nějaký údaj v originálním formátu zapsán do nesprávného pole, bude tento údaj nesprávný i ve zkonvertovaném záznamu).
Nabídka zdrojů
Pro přebírání záznamů je k dispozici široké portfolio zdrojů JIB. Využít je možné téměř všechny volné (nikoli placené - pozor, toto je změna oproti dosavadní praxi) prohledatelné zdroje JIB připojené pomocí protokolu Z39.50. Formát záznamů může být buď UNIMARC nebo MARC21, u jiných formátů nezajišťujeme konverzi. Úplný seznam zdrojů (cca 60) pro přebírání najdete na adrese http://jib-info.cuni.cz/prebirani. Seznam je zaktualizován současně s přidáním nových prohledatelných zdrojů do JIB. Pokud chcete zjistit, jaké nové zdroje jsou v nabídce, zobrazte si ve webovém rozhraní JIB (http://www.jib.cz) kategorii Nové zdroje. Všechny zdroje jsou opatřeny podrobným popisem.
Jaké zdroje vybrat?
Jaké zdroje pro přebírání vybrat? Nejvhodnějším zdrojem je katalog knihovny, která se strukturou knihovního fondu blíží vaší knihovně a kde je i podobná úroveň zpracování dokumentů (stejná nebo vyšší). Pokud zpracováváte cizojazyčné dokumenty, nezapomeňte na zahraniční zdroje. Vybrané zdroje si pak seřaďte podle důležitosti. V elektronické žádance na adrese http://jib-info.cuni.cz/prebirani pak vyplňte základní údaje o vaší knihovně a požadované zdroje v patřičném pořadí vyberte ze seznamu. Po odeslání žádanky z nich pro vás sestavíme tzv. profil. Tento profil, který představuje jméno databáze Z39.50 JIB, nastaví váš systémový knihovník, případně dodavatel vašeho AKS jako Z39.50 cíl pro vyhledávání a přebírání záznamů.
Jak probíhá vyhledávání?
Vyhledávání prostřednictvím modulu pro přebírání záznamů není paralelní, ale sekvenční (postupné). Váš dotaz je poslán nejprve prvnímu zdroji v profilu, v případě nalezení záznamů vyhledávání již dále nepokračuje. Pokud u prvního zdroje záznamy nalezeny nejsou, je dotaz zadán dalšímu zdroji v profilu atd. Sekvenční vyhledávání bohužel přináší jednu nevýhodu - u prvního zdroje v profilu může dotazu vyhovět záznam, který je neúplný nebo částečně chybný, a přitom v dalších zdrojích v profilu mohou být záznamy vhodnější. Sekvenční vyhledávání je technickým limitem modulu pro přebírání záznamů. Rádi bychom v budoucnu poskytli možnost paralelního prohledávání, stejně jako je tomu ve webovém rozhraní JIB. Jak je možné omezení sekvenčního vyhledávání řešit? Pro knihovny rádi připravíme více profilů, přičemž jeden profil může být souhrnný a další profily mohou obsahovat jednotlivé zdroje. Pokud nalezený záznam nevyhovuje vašim potřebám, zjistěte ze sigly v poli zdroj katalogizace, která knihovna záznam vytvořila (případně modifikovala) a dotaz zadejte jiné knihovně, kde předpokládáte další výskyt záznamu. Částečně předcházet omezení sekvenčního vyhledávání lze také filtrováním akvizičních záznamů, o kterém budu psát dále.
Jeden nebo více profilů?
Větší knihovny mají více než jednoho katalogizátora, či více než jedno oddělení zpracování dokumentů. Katalogizátor se přitom může specializovat např. na určitý obor a bude mít zájem vyhledávat v jiných zdrojích, než jeho kolega. Každý může samozřejmě využívat samostatný profil. V případě menší knihovny i jediný katalogizátor ocení možnost vyhledávat ve více profilech - první profil např. s českými zdroji, druhý se zdroji zahraničními atp. V takovém případě na http://jib-info.cuni.cz/prebirani požádejte o vytvoření dalších profilů (použijte žádanku opakovaně). Na tomto místě žádejte i o provedení změn, pokud vám již existující profil z nějakého důvodu nevyhovuje a přejete-li si změnit pořadí zdrojů nebo nahradit některý za jiný.
Konverze znakových sad
Z39.50 server JIB očekává dotazy a posílá nalezené záznamy ve znakové sadě UTF-8. Některé AKS používané v České republice ale tuto znakovou sadu nepodporují. Odeslané dotazy ze Z39.50 klienta a zároveň i přijaté záznamy je třeba konvertovat do znakové sady podporované vaším AKS. Pokud váš AKS sám neumožňuje konverzi znakových sad, zajistíme ji pro vás na straně JIB. Zajišťujeme konverzi do znakové sady ISO 8859-2 (ISO Latin 2) a Windows 1250 (CP 1250). Z UTF-8 je však možné převést jen znaky, které jsou obsaženy v národních znakových sadách. Některé záznamy tak budou ochuzeny o speciální znaky (např. ve španělské, francouzské či finské abecedě). Bylo by užitečné, aby AKS používané v ČR podporovaly UTF-8.
Filtrování akvizičních záznamů - výzva knihovnám
Při přebírání záznamů převážně nových titulů se může stávat, že je u prvního zdroje v profilu nalezen akviziční záznam (s pouze základními poli - název, autor, ISBN atp.), přestože u dalších zdrojů v profilu by mohl být stažen záznam kompletní. Protože vyhledávání je sekvenční a ne paralelní, není tak možné plný záznam z dalších zdrojů převzít. Řešením tohoto problému je odfiltrování akvizičních záznamů. Filtrování ale není možné provádět na straně JIB, je proto nutné, aby k němu docházelo už na straně knihoven, které nabízejí své záznamy pomocí Z39.50. Takové filtrování v běžné praxi již dlouhou dobu provádí Národní knihovna České republiky pro bázi NKC, v listopadu 2004 se k ní připojila i Vědecká knihovna Olomouc s bází SVK01. Budeme rádi, když tuto praxi zavedou i další knihovny.
Seznam knihoven, které využívají přebírání záznamů JIB (stav k 27. 5. 2005):
1. Centrální katolická knihovna
Statistika využití přebírání záznamů za duben 2005:
Jak vyhledávat
Dotazy je třeba zadávat přesné, nikoli obecné, na které by byly vráceny desítky či stovky záznamů. Pokud má dokument ISBN, vyhledávejte zásadně podle něj a dotaz nekombinujte s žádnými dalšími poli. Na takový dotaz bude vrácen nejvýše jeden záznam. Desítky nalezených záznamů by vás neúměrně zdržovaly. Množství knih ISBN nemá - zejména ty starší (v ČR vše před rokem 1989), které se zpracovávají např. při retrokonverzi či rekatalogizaci. V tomto případě použijte kombinace polí autor, název a rok vydání.
Novinky e-mailem
Pro informování o novinkách služby přebírání záznamů slouží elektronická konference prebirani()cuni.cz, kde jsou automaticky registrováni všichni žadatelé o profil. Registrovat je samozřejmě možné i další zástupce knihovny.
Závěr
Těší nás, že počet knihoven, které službu přebírání záznamů pomocí JIB využívají, narůstá, a že roste využití služby. Snažíme se ji dále zkvalitňovat a budeme usilovat i o rozšiřování nabídky kvalitních zdrojů vhodných pro přebírání záznamů. Budeme vám vděčni za vaši zpětnou vazbu. S připomínkami nebo případnými problémy se prosím obracejte na jib-support()cuni.cz.
|
http://info.jib.cz/informace-pro-knihovny/prebirani-zaznamu/prebirani/