Převod katalogu Pressfoto

Ve svém posledním článku o databázi pohlednic jsem se zmínil o katalogu pohlednic Pressfota, který jsem díky spolupráci kolegů získal a naskenoval. Přestože zájemců o spolupráci na převodu do textové podoby je zatím málo, nastal čas pro zveřejnění podmínek, za kterých tuto akci provedeme.

Úvodem chci nastínit, co od převodu tak velkého množství dat (397 stránek) očekáváme. Cílem této akce je převedení uvedeného katalogu do databázové podoby tak, aby mohl být později použit jako základ pro připravovanou databázi pohlednic.

A nyní již k převodu.

  • Snad má většina z nás má přístup k nějakému tabulkovému programu, nejčastěji k MS Excelu. Pro zpracování dat bych proto využil tento program. Jsem ochotný zpracovat údaje v podstatě v libovolném formátu (např. textový soubor s údaji oddělenými čárkou). Další podrobnosti ale nebudu rozepisovat, pokud někdo bude chtít použít cokoliv jiného, dohodneme se přímo.
  • Součástí balíčku pro převod bude i vzorový soubor. První list bude určen pro zápis údajů, druhý bude obsahovat záznamy, jejichž význam bude osvětlen níže. Tento druhý list bude zároveň i příkladem, jak údaje vyplňovat. Jak si čtenáři mohli všimnout v minulém článku, zapisuje se cca 7 údajů, pokud údaj není zadán, vynechává se.
  • Pokud bude mít zpracovatel dojem, že v údaji je chyba (překlep nebo významová chyba), zapíše toto zjištění resp. názor do dalšího sloupce určeného pro komentáře.
  • V katalogu jsou záznamy, u kterých jeden řádek odpovídá například šesti číslům. Takový řádek bude rozepsán na odpovídající počet řádků (tedy v tomto případě na šest), všechny údaje kromě čísla budou zkopírovány v plném znění (tedy včetně textu, nesmí se použít "dtto" nebo něco podobného).
  • V katalogu se občas objeví samotné číslo pohlednice bez dalších údajů. Vycházíme-li z předpokladu, že údaje v katalogu jsou ověřené, pak i to je informace, která by neměla zapadnout. To znamená řádek vyplnit bez dalších údajů.
  • Všechny záznamy budu sepsány v jednom souboru.
  • Pro název souboru nejsou žádné podmínky, je vhodné ho pojmenovat po autorovi.

Podmínku pro přístup k databázi jsem již zmínil v konferenci i v minulém článku. Úkolem bude převést pět naskenovaných stránek do textové podoby. Jak jsem se již zmínil, vzorový soubor bude obsahovat i druhý list. Ten bude obsahovat údaje také pěti stránek, které zpracoval někdo jiný. Druhou částí úkolu tedy bude kontrola údajů. Cíl je snad jasný - nikdo nejsme neomylní, v takovém rozsahu je kontrola velmi vhodná.

Odměnou za odvedenou práci bude - kromě dobrého pocitu z práce pro společnou věc - přístup k převedené databázi (resp. k dokončené části) a všem naskenovaným zdrojovým souborům. Protože kompletní katalogy mají v digitální podobě rozsah cca 250MB (velké rozlišení při skenování), jsem ochotný spolupracovníkům po dokončení jejich úkolu katalog vypálit a poslat na CD za cenu média a poštovného.

Převedené údaje budou k dispozici on-line na internetu s možností exportu aktuálního stavu. Spolupracovníci budou mít přístup k celému obsahu s možností vyhledávání. Ostatní návštěvníci stránek uvidí jen celkové údaje (např. počet záznamů), eventuálně si budou moci zobrazit jen část databáze.

Pro tuto chvíli vše, případné poznámky prosím zapište do komentářů pod článkem, před distribucí "domácích úkolů" mohu ještě případné požadavky zapracovat. Těším se na zájemce o spolupráci.



Autor: Petr Zaoral | 26. 10. 2005

Komentáře

Databaza

souhlas

Přidat komentář  | Zobrazit komentáře


© 2020 Filokartie.cz
ISSN 1214-4231
TOPlist