情報組織化研究グループ勉強会記録(2008年度)

「図書館目録の将来設計(続)」第4回


日時:
2008年3月5日 19:00〜
会場:
日図研事務所104号室
発表者 :
河手太士氏(大阪樟蔭女子大学図書館)
テキスト:
谷口祥一, 緑川信之『知識資源のメタデータ』 東京 : 勁草書房, 2007.5 (ISBN:9784326000319) 2.3(データ項目地の記述処理規則)、2.4(エンコーディング方式とデータベース設計)
出席者:
蔭山、横山、吉田(大手前大学)、田窪(近畿大学)、尾松(奈良県立図書館)、松井(大阪芸術大学)、堀池(摂津市施設管理公社)、渡邊(帝塚山学院大学)、杉本(相愛大学)

第2章 メタデータの設計

2.3 データ項目値の記述処理規則

正確かつ比較的詳細なレコードの作成に必要なこと
  ・レコード作成単位の扱い
  ・個々のデータ項目値の記録方法などを定めた記述規則の策定

2.3.1 レコード作成単位

・書誌レコードの作成単位(目録の場合):実体<資料>または<体現形>
  書誌レコードを作成する書誌単位については多様な議論
   日本目録規則の場合:「固有のタイトル」に基づき単位を設定
          ×形態上の単位 ×知的・芸術的な内容的区分に基づく区分
     →全体−部分関連という書誌レベルを適切に表現できる方式(図2-20,2-21)

・書誌レコードとしての記録
   中核のレコード(「タイトルと責任表示に関する事項」に対応するレコード)となる書誌レベルの決定
   書誌レコード内での構成法の決定
  日本目録規則の場合:単行資料のレベルでのレコード作成が原則
                 構成部分などの他のレベルでレコードを作成することも許容
                 集合レベルの情報(集合書誌単位):シリーズに関する事項
                 構成部分レベルの情報(構成書誌単位):「内容注記」
                  ★単行資料とセットものは排他的でない。

・「固有のタイトル」の明確な基準
  日本目録規則の場合:示されていない
   NACSIS-CAT:「固有のタイトル」とはみなさないものを列挙

・書誌単位や物理単位以外の単位づけ(知的・芸術的な内容上のまとまりに基づく単位など)
  著作の捉え方や解釈の仕方に安定性が保証されない
  <資料>または<体現系>レベルにおける著作単位の適用に揺れが生じる
      ★具体的な例が思いつかない。

・雑誌掲載の論文や記事を主対象とするメタデータ・データベース
           構成部分が対象(構成レベル)、雑誌などが継続刊行レベルに相当
  構成レベルと継続刊行レベルを異なるレコードとして作成する方法(JST Plus)
    構成部分に対応するレコードのみ作成し継続刊行レベルの情報は付加的に記録する方法

2.3.2 記録の方法

(1) 記述の情報源:対象とする知識資源のデータ項目値を記録する際に参照すべき箇所
     同一知識資源の参照箇所の相違によって記録に差異が生じる事態を回避 → 厳格な同定識別が可能に
   「記述の基盤」(日本目録規則):形態的に独立した知識資源のどの部分を優先的に参照すべきかを規定
     ★図書にはない
(2) 記録方法の原則
   「転記の原則」:規定の情報源に表示されているままに該当する値を忠実に記録すること
     ただし、優先する事項を適宜配慮して実際の記録方法は定められる
                  :同定識別・記録作業の容易さ・利用者にとっての分かりやすさ
   文字・記号の転記、補記と付記、誤記・誤植、書誌記述用語の言語、値の記録の簡略化

2.3.3 記述処理の実際:日本目録規則

(1) タイトルと責任表示に関する事項
      本タイトル、タイトル関連情報、責任表示
(2) 版に関する事項
      版表示、特定の版のみに関係する責任表示
(3) 資料(または刊行方式)の特性に関する事項
縮尺や図法など(地図資料)、譜面形式や判型(楽譜)、電子的内容・数量・大きさ(電子資料)等
(4) 出版・頒布等に関する事項
      出版地・頒布地等、出版者・頒布者等、出版年・頒布年等、製作項目(製作地・製作者・製作年)
(5) 形態に関する事項
      特定資料種別と数量、その他の形態的細目
(6) シリーズに関する事項
      本シリーズ名、並列シリーズ名、シリーズ名関連情報、シリーズに関する責任表示、
      シリーズ番号、下位シリーズの書誌的事項
(7) 注記に関する事項
      知識資源の特徴、書誌的来歴、内容細目など  定型注記、不定型注記
(8) 標準番号・入手条件に関する事項
      標準番号、キー・タイトル、入手条件・定価

2.3.4 記述処理の実際:SIST10

SIST10:「書誌データの記述」
       SIST04:「書誌的情報交換用レコードフォーマット(内形式)」
  転記の原則からかなり離れ、編集・加工を加えた記録方式を採用
(1) 著者等に関する事項
   個人著者名:情報源の表示の通りに記録、姓名の順に統一して記録 など
   団体著者名:当該機関使用の正式名称を記録(SIST06「機関名の表記」に従う)
(2) タイトルに関する事項
   タイトル:表示されているタイトルを書誌記述用の言語で記録、必要があれば翻訳
   逐次刊行物の巻次・版表示:アラビア数字に統一して記録
(3) 出版に関する事項:SIST06に従い記録、出版地は同名の出版者が存在するときのみ記録
(4) 会議名、開催回次、開催地、開催期間等
   会議名:正式名称を略記せずに記録
   開催回次と開催期間:アラビア数字を用いて記録
   開催地:都市名で記録
(5) その他の項目
   ISBN、ISSN、レポート番号など:表示されている通りに記録
   本文の言語、入手条件、参照文献の数、写真・図・表の数など

2.3.5 アクセスポイントの選定と統一形の選定

(1) アクセスポイント(そのうち特に標目)の選定規則
   タイトル標目:記述項目に記録されているタイトルから選ぶ (日本目録規則)
   著者標目:記述項目に記録されている個人・団体から選ぶ (日本目録規則)
   件名標目:採用している件名標目表・件名典拠ファイルから選ぶ
   基本記入標目:知識資源の成立に第一義的な責任を持つ個人・団体の著者標目を
             基本記入標目として選定する基本記入方式 (英米目録規則)
(2) 統一形の選定規則と典拠レコードにおける記録法
   日本目録規則における統一形の選定
    a) 個人名:原則として最初に出現したときにその知識資源に表示されている形を採用
           著名な・刊行物等が多い個人については、以下のものを採用
             ・参考資料等において多く用いられている形
             ・多くの刊行物で一致している形
           複数名称の同一著者はそれぞれの名称を独立した標目とする(図2-22)
                    ←複数名称の同一著者に一つの標目を採用(図2-23)国立国会図書館が採用
    b) 団体名:原則としてその団体の刊行物に多く表示されている形を採用
    c) 典拠コントロールの作業手順
       典拠ファイルを検索→典拠レコード内の統一形を書誌レコードに記録
         必要があれば典拠レコードの修正や新たな参照の追加
         該当するレコードがない場合は新たに作成して書誌レコードに記録

2.4 エンコーディング方式とデータベース設計

 エンコーディング:メタデータ表現の基本的な枠組み、レコードの構造にかかわる規格化
 エンコーティング・フォーマット、エンコーティング・スキーマ:エンコーディングの事項を規定したもの

2.4.1 MARCフォーマットによるエンコーディング

・エンコーディングはメタデータの特性に合致することが求められる。
  可変性かつデータ項目の出現の有無および出現回数が不定
   ・データ項目:個々のデータ項目の区切り、識別、他のデータ項目との関連づけ
   ・データ項目のグループ:データ項目グループの識別、データ項目グループ間の関係づけ
   ・レコード:レコード全体の構成、レコードの識別、レコード間の関係づけ
   ・その他、文字の表現形式、レコード交換時に用いる記録媒体についての情報など

・MARCフォーマットによるメタデータ交換 (図2-24)
   ★データ交換が前提
   MARCフォーマット
     (1) 内形式(内容識別子の規定)
          フィールド識別子:別名「タグ」、3桁固定の数字、フィールドの同定識別に使用
          指示子:別名「インディケータ」
               フィールド内のデータに対する付加的な情報を示す
               データ処理時において要求される特定の処理に関する付加的情報提供 など
          サブフィールド識別子:別名「アイデンティファイア」
                   サブフィールドの同定識別
                   サブフィールド処理上の付加的情報を示す
         言語や目録規則に依存、MARCフォーマットにより異なる
            UNIMARC (国際図書館連盟) → Japan-MARC典拠レコード
            MARC21フォーマット (英米目録規則)
     (2) 外形式(レコード構造の規定)
         特徴:ディレクトリ方式によるレコード構造=「レコードラベル+ディレクトリ+データフィールド群」
                       レコードラベル:レコード全体の管理情報を記録
                       ディレクトリ:フィールド識別子の位置を記録
                       データフィールド群:データ項目とその値、内容識別子
         MARCフォーマットの限界・問題点:論理的構造表現力の限界、柔軟性の欠如

2.4.2 XMLを用いたエンコーディング


・XML(eXtensible Markup Language、拡張可能マークアップ言語)
  個々のデータ項目値や文章の個々の項目にタグ(データ項目名と付加情報を示すもの)を付加することによって、
  その意味や構造を示す方法

・MARCXML (図2-26)
  米国議会図書館が策定
  MARCフォーマットによりエンコードされているレコードを単にXMLに表現し直したもの

・よりXMLの表現力を活用するために
  書誌レコード用:MODS (Metadata Object Description Schema)
  典拠レコード用:MADS (Metadata Authority Description Schema)

2.4.3 データベース設計

・一般的なデータベースの設計:概念設計→論理設計→物理設計
  概念設計:対象となる事象をどのように取り上げ表現したいかを要求・制約事項としてまとめ、概念モデルを構築
  論理設計:構築された概念モデルをデータベースシステムとして実現可能なモデルに変換し、倫理モデルを構築
    論理モデルを記述する言語(データモデル)
      リレーショナルデータベース、ハイアラキカルデータモデル
      ネットワークデータモデル、オブジェクト指向データモデル
  物理設計:データベース管理システム(DBMS)に合致したデータベース・スキーマを定義
         データベース管理システムが提供するデータ記述言語を用いる 例)SQL(Structured Query Language)

・メタデータ・データベース:レコードという単位が重要な意味を持つことが前提

・メタデータ・データベースをリレーショナルデータベースの論理モデルへ変換する手順
  (1) 手順1:レコードからリレーションへの変換 (図2-27,2-28,2-29,2-30)
         個々のレコード(「書誌」「著者名典拠」など)をリレーションに変換
         主キー(組みを一意に識別できる属性)の設定:書誌IDや著者ID
         正規化(ノーマライゼーション):属性間の冗長性や矛盾を排除
  (2) 手順2:レコード間関連リレーションへの変換 (図2-31)
         レコード間の関連を表すリレーションを定義=「書誌」のレコードと「著者名典拠」のレコードを関連づける
リレーションを作成
   手順1と手順2で定義したリレーションとその関連(図2-32)
  (3) 検索用のキーの設計
     検索を高速に実現するための検討とデータベース管理システムに対する定義
       データ項目値の分割、文字の正規化、検索キー(インデックスキー)の生成 など