Wikidataに地ビール醸造所のデータベースを構築(下調べ)

Wikidata利用の練習として大好きな地ビールのデータをいれてみようかと思う。

下調べ:ブリュワリーの登録状況

Wikidata エンドポイントにて、以下のSPAQL文を入れるとビールのブリュワリーの情報が表示される。ヒット件数は1,459件

SELECT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q131734.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ja". }
}

Wikidataにおけるプロパティと概念のIDは以下の通り

  • wdt:P31 = instance of(分類)
  • wd:Q131734 = brewery(ビール醸造所)

ヒットした醸造所の例は以下の通り。

上記醸造所の項目は以下のとおり。

Erdinger

  • instance of (P31, 分類) -> brewery(Q131734)
  • inception (P571, 創立日)
  • country (P17, 国)
  • headquarters location (P159, 本部所在地)
  • legal form (P1454, 組織形態) -> (P460178, 有限会社)
  • official website (P856, 公式サイト)
  • product or material produced (1056, 生産品目) -> (Q44, ビール)
  • Commons category (P373, コモンズのカテゴリ)

Spaten

  • instance of (P31, 分類) -> brewery(Q131734), trademark(Q167270, 商標)
  • inception (P571, 創立日)
  • country (P17, 国)
  • location of formation (P740, 結成場所)
  • headquarters location (P159, 本部所在地)
  • official website (P856, 公式サイト)
  • Commons category (P373, コモンズのカテゴリ)

Orval Brewery

  • instance of (P31, 分類) -> brewery(Q131734), trademark(Q167270, 商標), beer brand (Q15075508), beer in Belgium (Q348229, ベルギービール), Trappist beer (Q505815, トラピストビール)
  • inception (P571, 創立日)
  • country (P17, 国)
  • located in the administrative territorial entity (P131, 位置する行政区画)
  • owned by (P127, 所有者)
  • headquarters location (P159, 本部所在地)
  • official website (P856, 公式サイト)
  • Commons category (P373, コモンズのカテゴリ)

麒麟麦酒

  • instance of (P31, 分類) -> brewery(Q131734), business enterprise (Q4830453, 企業)
  • name in kana (P1814, 読み仮名)
  • inception (P571, 創立日)
  • country (P17, 国)
  • located in the administrative territorial entity (P131, 位置する行政区画)
  • owned by (P127, 所有者)
  • headquarters location (P159, 本部所在地)
  • official website (P856, 公式サイト)
  • Commons category (P373, コモンズのカテゴリ)

下調べ:ビールにひっかかる項目

以下で検索できる。結果は206件。そのほとんどが醸造所かブランド。

SELECT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q44.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "ja". }
}

下調べ:ビールのスタイル

Wikipediaのビールのスタイルから対応するIDを調べる。

ビールのスタイルで検索

SELECT ?item ?itemLabel WHERE {
  ?item wdt:P31 wd:Q1998962.
  SERVICE wikibase:label { bd:serviceParam wikibase:language "en". }
}

47件ヒット。多くのスタイルは既に登録済みみたい。

下調べ:ビールの銘柄

ビールのスタイルのうち白ビールで調べたところ、いくつかビールの銘柄がヒットした(主にオランダのWikipediaのデータ)。

それで分かったのは、製造元(P176)で醸造所とビールの銘柄をつなぐのが一般的みたいであるということ。

とりあえずの結論

醸造所の登録までは問題なくできそう。既に前例がある。ブランドの登録は微妙。

「エビスビール」はサッポロビールが出しているビールのブランド名(銘柄)であり、「シルクエビス」は、エビスビールブランドのビールである。この「シルクエビス」を指す用語は何?

第8回LinkedData勉強会に参加した

第8回LinkedData勉強会に参加してきた。

この勉強会の申し込みのお知らせの数日前にWikidataに出会い、「いったいどういうサービスなんだ?」と疑問に思っていたので渡りに船だった。

疑問に思っていた点は以下のとおり。

  • DBpediaとWikidataの関係は何?
  • Wikidataが扱っているデータの特性は?
  • Wikidataのデータフォーマットはどうなっているの?
  • Wikidataのデータ入力の方法は?

上記の疑問はこの勉強会でおおよそ解決された。

DBpediaとWikidataの関係

講演者の山本さんの資料参照。DBpediaはWikipediaのLinked Data化が目的、Wikidataはいろいろな構造化データをWikipedia的に集めるのが目的。

Wikidataが扱っているデータの特性

知識処理の分野にデータ・情報・知識・知恵階層モデル(Data-Information-Knowledge-Wisdom Hierarchy, DIKW hierachy)というのがあり、Rowleyという人がどういう意味でデータ、情報、知識という言葉を定義しているのかをサーベイしている(Rowleyの論文)。その内容をまとめると以下の画像のような定義になる。

f:id:yuichigoto:20170426122229p:plain

Wikidataでは、上記の定義のデータレベルのものを扱っているのではなく、データを選択し、かつ、構造化(オブジェクト指向のデータ表現)しているため情報のレベルで取り扱っている。各オブジェクトの必須入力データは「ラベル」であり、ラベルとしてモノや場所、概念の名前が入力される。各オブジェクトはプロパティをいくつも持つ。プロパティとしては住所、座標(緯度経度)などがある。

WikidataもWikidataを引き継いで特筆性(notability)や二次資料に基づいて書くというのを方針として持ってはいるものの、あんまり守られていないとのこと。Wikipediaの文書に対しての要求とWikidataの情報に対する要求では特筆性(notability)が異なるのは当然。また、文書は情報を処理した結果作られるものなので情報が生のまま載っていることはマレ。よって、二次資料に基づいてデータ入力するというのは基本的に難しいと思う。

当日の勉強会で質問したところ、現実世界に実物があるならばそれを根拠としてデータを入力するのは良いのではないかという意見をもらった(「たとえば、カップ麺の情報をカップ麺のパッケージなどを根拠にWikidataに入力するのはどういう扱いになるのか?」という質問)

特筆性(notability)については、講演者の東さんも述べていた。

www.slideshare.net
qiita.com
qiita.com:特筆性に関する整理

由来

qiita.com

Windows 10でスタートボタンが効かなくなったとき

発端

ある日Windows 10のスタートボタンが効かなくなっていた(マウスの左ボタンをクリックしても反応しない)。なお、スタートボタンと呼んでいるのは下の画像の赤丸部分のこと。
f:id:yuichigoto:20160425184158p:plain

右クリックには反応する。
f:id:yuichigoto:20160425184353p:plain

とても不便なので解決をはかった。

Windows イメージを修復する

私の例はWindowsのイメージを修復したら治った。たぶん、Windows 10のセキュリティパッチ適用時(Windows Update)のときにトラブルがあったのだろうと思う。

まず、実行中の他のプロセスを終了させる

どのくらい影響があるかわからないけれども、別のプロセス(特にハードディスクに書き込みをするようなもの)が動いているとよろしくないので自動起動のソフトウェアを停止させる。

管理者権限でコマンドプロンプトを起動する

スタートボタンで右クリックをし、「コマンドプロンプト(管理者)」を選択する。以下の図参照。
f:id:yuichigoto:20160425184353p:plain

Windows イメージの修復

コマンドプロンプトで以下のコマンドを実行する。20分~40分くらいかかった。

dism /online /cleanup-image /restorehealth

上記のコマンドが終了したら続いて以下のコマンドを実行する。

sfc /scannow

上記のコマンドが終了したら、Windows 10を再起動する。私の場合は、これで問題が解決した。

Windows 8を使いやすくするTips

Windows 7 から Windows 8に切り替えた。Windows 8はタブレットPCを念頭において作られているようなので、デスクトップPCやノートPC(ラップトップPC)でつかうという目的からすると不便な点がいくつかある。それをカスタマイズしたときのメモ。

Windows XP~7のような「スタート」ボタンを表示する

デスクトップPCやノートPC(ラップトップPC)でWindows 8 を使うならば、Windows XP~7のような「スタート」ボタンがあったほうが使いやすい。Classic Shell というフリーウェアをインストールすると「スタート」ボタンを作ってくれる。

学生のみなさんは個人利用が主のはずなので、アンケートに回答するのが嫌でなければ日本語版をインストールすれば良いと思う。私は、大学で使うPCにインストールしたかったので、本家の英語版をインストールした。ただし、英語版でも「スタート」ボタンに関してはいまのところ特に問題が無い(ちゃんとメニューは日本語表示されている)。

コマンドプロンプトで自動的に日本語入力が有効になるのを停止する

現在のネットワークカードの状態をチェックできるipconfigコマンドなどをつかうときにコマンドプロンプトを使用するが、Windows 8ではコマンドプロンプト起動時に日本語入力(IME)が有効になっており、いきなりコマンドを打てない。そこで、日本語入力が起動時に有効にならないようにする。

日本語入力時の予測入力(予測変換)機能の停止

キーボードを使って高速に入力できるため、予測入力機能があると動作が遅くなり面倒。そこで、予測入力機能を停止する。

文字コードの違い、および、改行コードの違いを気にせずにテキストファイル開けるテキストエディタを用意する

LinuxUnixで作成したテキストファイルをWindowsのメモ帳(notepad)で開くと、文字コードや改行コードの違いに悩まされることがよくある。そこで、文字コードの違いや改行コードの違いを気にせずにテキストの編集を行えるテキストエディタをインストールしておく。なお、テキストエディタは好みが非常に分かれるツールなので、お好きなツールを探してインストールすればよい。

私はTerapadというテキストエディタをよく使っている。

隠しフォルダの表示、および、拡張子の表示をするように設定する

これは、Windowsのバージョンに関わらずやっておいたほうが便利。

ログイン後にすぐにデスクトップを表示する

現在は、ログイン後にメニュー画面が表示される。この画面をスキップしてログイン後にすぐにデスクトップが表示されるようにする。

補足:上記ページのフォルダはデスクトップ左下のフォルダーアイコンをクリックし、開いたウィンドウで「コンピュータ」→「XXX(C:)」(XXXは人によって異なる)→「ユーザー」→「Windows 8の自分のログイン名」→「AppData」→「Roaming」→「Microsoft」→「Windows」→「スタート メニュー」→「プログラム」→「スタートアップ」という順番でたどりつける。

課題を家で行う環境を整備する

ノートPCやデスクトップPCの性能がそれなりに良いならば(メモリ4GB以上、ハードディスクドライブの残り容量が50GB以上ならば)、Windows OS上に仮想マシンを構築し、そこにLinux環境を整えるのは勉強になるし、かつ、Linux上でやらなければならない課題を家で行えるようになるので悪くないと思う。

以下のページの「論文執筆環境をUbuntu上に整える」までを行うと、情報基礎で扱う範囲のソフトウェアをそろえることができる。

画像をフォトでなくWindowsフォトビューアーで開く

タブレットPCでない場合はWindowsフォトビューアーで画像を閲覧する方が便利

sXXtiYYYによるブックマークについて

下に追記あり(2013年4月16日)

はてなブックマーク利用者のみなさま、こんにちは。

埼玉大学工学部情報システム工学科1年生向け授業「情報基礎」を担当している後藤と申します。

はてなブックマーク - 西部総合病院 トップページなどで、「sXXtiYYY」というアカウントが並んでいますが、スパムではありません。これは、私の担当授業「情報基礎」において、指定したWebサイトを見つけてブックマークするという課題を行っている結果です。この課題は、ソーシャルブックマークを紹介するため、また、今後の課題のための準備として行わせています。

以下の条件を満たすサイトがホッテントリーに上がることがあると思いますが、それはこの課題のためです。情報収集にご不便をおかけいたしますが、ご容赦ください。以下、課題ページより転載します。

以下の情報を検索し,その結果をはてなブックマークにブックマークしておく(後日、Webページの作成の際に使用します)

  • 自分が使っている携帯電話会社が提供している災害用伝言ダイヤルサービス
  • 文部科学省が提供している放射線モニタリングデータ
  • 東日本大震災においてネット上で発生したデマ(少なくとも3例)
  • JR東日本の運行情報
  • 電車の乗り換え検索サービス
  • 南与野、北浦和駅の電車の時刻表
  • 日本の人口の平成24年10月確定値
  • 明日のさいたま市の天気
  • 埼玉大学発着のバスの時刻表
  • 埼玉大学近郊のみずほ銀行、三菱東京UFJ銀行三井住友銀行、りそな銀行の支店、ATMの場所
  • 平成24年度大学等卒業予定者の就職内定状況
  • CFAフラン基軸通貨単位とする国の在日大使館のページ(3つ以上)
  • 埼玉大学の平成25年度学生定期健康診断の実施日程
  • 埼玉大学の建物・教室配置図(ヒント:在学生用のページよりリンクでたどっていく)
  • 埼玉大学が提供している休講案内
  • 埼玉大学が提供している落し物情報
  • 国会図書館の蔵書検索システム
  • Webブラウザーを開発・公開しているサイト(少なくとも3つ)
  • メーラーを開発・公開しているサイト(少なくとも3つ)
  • Webメールサービス(少なくとも2つ)
  • 埼玉大学近辺で土日も郵便業務を行っている郵便局
  • 埼玉大学近辺の総合病院(少なくとも2つ)
  • 埼玉大学所有の軽井沢にあるセミナーハウスの申し込み方法が分かるページ
  • 埼玉大学学内無線LANのつなぎ方の説明があるページ
  • 埼玉大学学内有線LANのつなぎ方の説明があるページ
  • クラウドソーシングを提供しているサイト(少なくとも2つ)
  • クラウドファンディングを提供しているサイト(少なくとも2つ)
  • Linuxディストリビューションのオフィシャルページ(少なくとも3つ)
  • プログラミング言語のオフィシャルページ(少なくとも3つ)
  • Cygwinのオフィシャルサイト
  • 仮想化ソフトウェアのオフィシャルサイト(少なくとも3つ)

追記(2013年4月16日)

ご迷惑をおかけしております。

はてなブックマーク - sXXtiYYYによるブックマークについて - yuichigotoのブログでいただいたコメント、および、はてなの法務関連窓口からご説明いただき、大変なご迷惑をおかけしていることをやっと理解いたしました。上記では「スパムではありません」と申しましたが、はてなブックマークの利用者のみなさまからみれば、スパムと同じ行為をしているのですから、スパムとみなされて当然でありました。

はてなブックマークの利用者のみなさま、ならびに、はてなのご担当者さま、また、ブックマークされたサイトの管理者のみなさまに、深くお詫び申し上げます。

状況報告

私の担当しております工学部情報システム工学科1年生向け授業「情報基礎」では、2011年度から授業の一部にはてなのサービスを利用しています。具体的には以下の2つの用途です。

  1. 指定したサイトをはてなブックマークでブックマークする
    • このエントリーの本文で説明しているもの。第1回目の授業、だいたい4月第2週に実施
  2. 47 Newsに掲載されている記事の要約エントリーをはてなブログ上に30エントリー以上書く

このため、私は、はてなブックマークにおけるスパム行為を2011年4月、2012年4月、2013年4月の3回行ないました。

現在は、はてなのご担当者さまのご配慮でブックマーク数の集計や表示の対象から除外する措置を取っていただいております

私の指示でスパムを実施することになってしまった学生には、授業の際に謝罪いたしました。

今後について

事前にはてなのご担当者さまと相談し、みなさまにご迷惑お掛けしないようにいたします。具体的には以下を行ないます。

  1. 事前に作成予定のアカウントを報告し、事前にブックマーク数の集計や表示の対象から除外する措置をとっていただく
  2. ブックマークの課題を出す時期をあらかじめ報告する
問題と認識しなかった理由

この項は言い訳になります。ですが、なぜ、私が今回の行為を問題であると認識していなかったかについてご興味がある方もいらっしゃると思いますのでご説明いたします。

以下の3つが理由です。

  1. ホッテントリーに、ほんとど入っていなかったため。入っても一時的であるならば問題はないと思っていたため
  2. はてな社への事前連絡が必要であると認識していなかったため
  3. 被ブックマークサイトがスパムサイト認定されると知らなかったため

私も、はてなブックマークユーザです。このため、はてなブックマークは定期的に見ていました。2011年および2012年のはてなブックマークは、被ブックマーク数を100程度とっていないとホッテントリーに掲載されないと認識していました。私が担当する情報基礎は受講生がたかだか70人程度であること、また、指定しているサイトは政府機関のサイトを除き、いくつかの候補があることから被ブックマーク数が50くらいで収まるだろうと考えていました。よって、この課題によりホッテントリーには入らないので、情報収集の妨げにはならないだろうと考えていました。

実際、2011年、2012年は2~3つが一時的にホッテントリーに入っていただけだったと記憶しています。実際には、はてなのご担当者さまがブックマーク数の集計や表示の対象から除外する措置を取っていただいていたとのことです。今回、sXXtiYYYによるブックマークについてのエントリーを書いた理由は、はてなブックマークがリニューアルされ、被ブックマーク数が数十でもホッテントリーに入るようになったためでした。

実際にホッテントリーに数回入っていても翌年度に同じことを続けた理由は、3の理由を認識していなかったため、大きな問題ではないと考えていたからです。

2の理由についてですが、そもそも、授業ではてなのサービスを使おうと思ったのは、授業目的や私がはてなユーザーだったからだけでなく、はてな社が授業で使うことを推奨してくれていたからです。

教育ソリューション:授業で使うはてなを見るかぎり、はてなダイアリーだけでなく、はてなブックマークも推奨されており、ちょうど授業の目的と合致していたためにこの二つのサービスを利用しました。

一方で、教育ソリューション:授業で使うはてなのページには、授業で使う際には事前に連絡が欲しいという記載はなく、事例として報告して欲しいというがありました。また、問い合わせについても使い方に関しての問い合わせ窓口のように読めました。以上のことから、私は、はてな社への事前連絡が必要であると認識しませんでした。

また、授業ではてなブックマークを使った場合には、今回のように学生が短期間に同じサイトにブックマークをつけるという行為は当たり前に起こると私は思っていたので、はてなも了解済みである考えていました。1の理由と合わせて、今回の話が問題になるとは考えていませんでした。

3つ目の理由についてですが、これは今回はてなの法務関連窓口からご説明いただき始めて理解しました。スパム認定は、ブックマークする側がされるものだと考えており、ブックマークされる側も認定されるというのは理解していませんでした。

以上、言い訳になり大変申し訳ありませんが、今回の行為を問題であると認識しなかった理由は以上のとおりです。

はてなブックマーク利用の目的

ブックマークコメントではてなブックマーク利用の意図を尋ねられている方が何人かいらっしゃいましたのでお答えいたします。はてなブックマークを利用した一番の理由は、授業を行なっている端末室と自宅でブックマークを共有するのに一番都合が良いサービスであったためです。

担当授業は、Unix環境の導入授業です。学生の多くがUnix環境は初経験であり、Unix環境上でのファイルの作成、メール送信などをしたことがありません。この授業の第一回では、授業のガイダンス、ログイン・ログアウトおよび、簡単なUnixコマンドの紹介およびUnix環境におけるWebブラウザの使い方を教えました。この授業の第一回目の課題として出したのが指定のサイトをブックマークするという課題でした。

この指定のサイトをブックマークするという課題の目的は以下のとおりです。

  • 今後いろいろ調べることになるので、検索エンジンの使い方を復習する
  • いろいろな情報がWeb上に公開されていることを紹介する
  • 埼玉大学の学生として役立つサイトを紹介する
  • 情報システム工学科の学生として役立つサイトを紹介する
  • Webページの作成の回の課題でつくるリンク集の材料を集める

この課題はある程度時間がかかる(小一時間)と予想しました。一方で、すべての学生が下宿生ではないことから、自宅でも課題を実行できるようにする必要がありました。つまり、大学でも自宅でも課題を行なえるようにする必要があると考えました。一方で、Unix環境導入の初回の授業であるため、学生にはテキストエディタやリモートログインの仕方を教えていません。このため、Webブラウザだけを用いて、探し出した結果を記録できる必要がありました。また、別の課題としてはてなブログを利用するため、受講生は全員、はてなのアカウントを作ることにしていました。

以上より、この授業のこの課題を行なうのにはてなブックマークが一番、都合の良いサービスであると判断しまし、はてなブックマークを使わせることにしました。ちなみに、はてなブックマーク利用を強制するのはこの課題だけです。

おわりに

あらためて、はてなブックマークの利用者のみなさま、ならびに、はてなのご担当者さま、また、ブックマークされたサイトの管理者のみなさまに、深くお詫び申し上げます。

共同通信:東電、計画停電打ち切り発表 夏も原則回避

記事リンク

共同通信:東電、計画停電打ち切り発表 夏も原則回避

記事要約

東京電力は4月8日に計画停電の実施を8日以降打ちきることを発表した。また、夏も原則として実施しない方針であることも発表した。他にも計画停電を実施した地域の利用者の電気料金を割り引くことも発表した。

疑問

今から始めて、7月までにガスタービン発電設備の新設は間に合うのか? 7月末には約1千万キロワットの供給不足が予想されるとあるが、これほどの電力を新設する設備だけでまかなえるのか?

考え・主張

2003年のヨーロッパ大熱波において、ヨーロッパ全体で超過死亡は2万人以上でたとのこと(ソース)。これは、ヨーロッパは日本に比べて寒いためエアコンなどの設備が整っておらず、高齢者が無くなったためだ(ただし、死者の大多数はフランスででており、フランスでこれほどの死者がでた理由は熱波のためだけではないとのこと 2003 年夏、フランスにおける猛暑 -猛暑から見えたもの- 中島 貴子)。近年の関東地方は、7月~9月にかけて、夜は25度以上、昼間は35度近くのことが多い。このような状態で、エアコンが使えないならば、2003年のヨーロッパのように多くの死者を出してしまう可能性があったと思う。このような観点からも、計画停電の打ち切りが発表されたのは、良い話であると思う。

その他

特になし。