kzhr's diary

ad ponendum

『人文情報学月報』「Digital Japanese Studies寸見」第71回「DH Awards 2020開催」補遺

今回の月報の連載では、DH Awards 2020について取り上げたが、紙幅のつごうもあり、すべての候補作を取り上げることができなかった。以下では、そののこりを取り上げて補遺としたい。 dhawards.orgBest Use of DH for Public Engagement(一般参加)部門では…

本が出ます(2)

前回の記事でご案内した本*1は、もともとは博士論文として書かれたものでした。リンク先から読めますが、検定制度と仮名字体の関係を描いた、中心となる論文3篇+αという感じでした。そこから、こんな壮大な書名を持つ本がどうやってでてきたかといえば、まあ…

本が出ます

近代平仮名体系の成立: 明治期読本と平仮名字体意識作者:岡田 一祐発売日: 2021/02/26メディア: 単行本紹介等は出版社ウェブサイトをご覧下さい: 岡田一祐『近代平仮名体系の成立 明治期読本と平仮名字体意識』(文学通信) - 文学通信

Eighteen years with Wikipedia

This is notes for a coming event.It was a slashdot article that brought it to my attention that has been there ever since. Honestly, it was the second time that I saw it. The first time was a disappeared HotWired Japan's coverage that focu…

時刻合わせ over Proxy

qiita.com をやってみたけど、date --setはGNU dateのオプションのようであるし、wgetはさいきんのMacにはすくなくともデフォルトで入っていない。ということで、macOS Catalina版のメモ。 sudo date -f "%s" "$(curl -s https://ntp-a1.nict.go.jp/cgi-bin/…

ここ10年の言語学系新書

言語系新書ということであれば、CiNiiで検索すれば済む話ですが、言語学系となるとまた。独断と偏見で。 80*系 CiNii 図書 - ハングルの誕生 : 音 (おん) から文字を創る CiNii 図書 - ことばと思考 CiNii 図書 - 外国語をはじめる前に CiNii 図書 - ことば…

やきっぺの個人的に好きな調理法

北海道には、やきっぺというご当地インスタント焼きそばがあり、ただのインスタント焼きそばなのだが、みょうに好きである。たいしたことはいつもどおり書かないのだが、個人的においしいと思える調理法が確立されたのでメモしたいということである。材料は…

定訓であることについて ウチはなんの定訓であるのか*1 定訓と常用漢字表 山田(一九七一)は、定訓であることについて、つぎのやうに述べてゐる。 某一字について、その呼称を考へる時に、直ちに喚起される字訓を、先づ第一にその字の定訓(またはその一つ…

着任エントリ

北海学園大学に着任しました。人文学部日本文化学科講師です。4年と7か月ぶりの札幌です。東京圏ではお世話になりました。ひきつづき北海道でもよろしくお願いいたします。

退職エントリ

退職しました。

国語研天草版テキストから対比できそうな四つ仮名を取り出すスクリプト

#!perl use strict; use warnings; use utf8; use open qw/:std :utf8/; my $substr = 3; # まとめ文字数 my $file = shift @ARGV; open my $fh, "<", $file or die; my %match; my $fno = ''; my $lno = 1; my $llno = 0; my $skip = 0; while (my $line = …

移転記

はてなダイアリー廃止を機に移転してきました。

IDSをふくむテクストを一字づつ切り出すperlスクリプト

use strict; use warnings; use utf8; sub ids_split { my $text = shift; my @chars = split //, $text; my @split; my $buffer_text = ''; my $buffer_num = 0; for my $char (@chars) { if ($char =~ /[&#12272;&#12273;&#12276;&#12277;&#12278;&#12279;…

臨時仮名遣調査委員会議事速記録(1909)の著作権に関するおぼえがき

たとへば、国会会議録検索システム -FAQ-など。臨時仮名遣調査委員会議事速記録 - 国立国会図書館デジタルコレクションにあるが、文部大臣官房図書課だけの著作権を認めてよいのかはよく分からないところなので(あるいは個々に調べてあるのかもしれないが、…

「日本古典籍字形データセットをかんたんに分類してくれるPythonスクリプト」の結果を(手で)修正した量の統計を出すスクリプト

#!/usr/bin/perl use 5.012; use strict; use warnings; use utf8; use Cwd; use FindBin; use Data::Dumper; require "$FindBin::Bin/clgr.pl"; my $wd = Cwd::getcwd(); my @directories = clgr::scan_dir($wd); say join ",", 'Mat', 'U+ID', 'Total', 'E…

「日本古典籍字形データセットをかんたんに分類してくれるPythonスクリプト」の結果を修正してHTMLに再出力するスクリプト

#!/usr/bin/perl use 5.012; use strict; use warnings; use utf8; use Cwd; use FindBin; use Data::Dumper; require "$FindBin::Bin/clgr.pl"; my $now = time(); my $wd = Cwd::getcwd(); my @directories = clgr::scan_dir($wd); for my $dir (@director…

日本古典籍字形データセットをかんたんに分類してくれるPythonスクリプト

#!/usr/bin/python3 # coding: utf-8 # # Usage: Run on the directory just above where the Dataset of PMJT Character Shapes # (http://codh.rois.ac.jp/char-shape/) is downloaded # from pathlib import Path from time import time from PIL import …

pptx2md

#!/usr/bin/python #coding: utf-8 import sys from pptx import Presentation if __name__ == '__main__': prs = Presentation(sys.argv[1]) c = 1 for slide in prs.slides: print("# Slide " + str(c)) s = 1 for shape in slide.shapes: if not shape.ha…

Perlのregex?

正規表現でのメールアドレスチェックは見直すべき – ReDoS – yohgaki's blogを見て,Perl 5だとどうなるんだらうと書いてみた。ちなみに,perl 5.18.2とruby 2.0.0p648。 use strict; use warnings; use feature qw/ say /; use Time::HiRes qw/ time /; for…

非欧文中の算用数字を漢数字に置換してくれるかもしれないマクロ

Macでも使へるやうにとRegExpなしでやってみたものの,よくわからないエラーで動かなかったので動くのかもよく知らない。もっとすっきり書けるのではと思ふが,VBA初心者すぎてよく分らない。 Option Explicit ' ' Arabic2HanInJa by Kazuhiro Okada ' A mac…

外字を使ってWordデータを送ってきたときのこと

今後役に立つか分らないが,備忘までに。 状況 Office XMLなWordデータ EUDC.TTE + EUDC.EUF どっかの.TTFデータ ここでOffice XMLぢゃないとたいへんかも? 外字の使用場所がかんたんに分るなら可。今回は,論文で,縦横に使ってゐた(やめてほしい……)。 外…

Tue, Nov 20

23:24 ふつーにきまっとる: 【中国発】孫のネットショップのためにモデルを務めた72歳のおじいちゃんが意外にも大ブレイクしている件 | IRORIO(イロリオ) - 海外ニュース・国内ニュースで井戸端会議 http://t.co/3FZWDqDY 23:22 そういえば土日ひさびさに…

Mon, Nov 19

23:28 @funayamn @otamatic ねえ。 [in reply to funayamn] 23:24 @otamatic なんの笛で? [in reply to otamatic] 23:23 @koikekaisho じぶんの失敗をいつまでも持ち出すひとですか? けっこういますね^^;; あんまりしつこいと,相手に対して失礼にあたると…

Sat, Nov 17

14:18 o_o 14:18 RT @LustyNoise: 結局文章書けなかったが、一つだけ。松本総長がAERAの編集長との対談で語っていたが、はっきり言って「俺、日本人にしては教養あるって外国で褒められたんですよ」なんて言うような人間に僕はあまり教養を感じない。教養は…

Thu, Nov 15

21:04 @rhetorico なんとかxファイルは、Office XMLとかいうISOの規格になってるので、いちおう公知の事項のはずです [in reply to rhetorico] 20:59 ……田村だっけ? 20:59 RT @ishilinguist: 「谷亮子の旧姓ってなんですか?」←今日ジェネレーションギャップ…

Tue, Nov 13

23:48 @hidenosuke おいしいですよねー [in reply to hidenosuke] 23:42 なんか食べたいのあったなあと思ったけど,そうだ,横川の釜飯…… 23:40 RT @horuf: 今週末のもじもじカフェ番外編,人が集まらないの〜 誰か来て〜 貴重な映像が見られますよ〜 文字好…

Mon, Nov 12

23:43 RT @sho_n820: デザインって「正解」はないんだけど「これは違う」はあると思う。。だからコワイ。 23:42 @Mitchara 資料を傷める恐れのあるものは極力避けよということじゃないんでしょうか [in reply to Mitchara] 23:38 AはBと述べる。CはDだという…

Mon, Nov 05

23:48 @sugim 平和的解決! [in reply to sugim] 23:42 @sugim @jellyfish_chika それを押しのけるだけの熱意があるのかと思ってました(まがお [in reply to sugim] 23:27 @sugim よく分りませんがそんなに見たいならそこらへん歩いてる女性にお願いして見…

Sat, Nov 03

23:26 RT @ogawaissui: 私から言うのもなんですが、「完結したら買います」と言われましても、途中巻を買ってくださる読者がいなければ、当然打ち切りになります。 23:03 RT @takot: dqnplusとかkinisokuの記事で韓国・中国のことを語る人って何なんすかね。…

Fri, Nov 02

23:59 @carkuni そういえばそうで [in reply to carkuni] 23:57 前者は,もしアクセスするなら$a->{a}->[0]ってなるんかね。後者は$a->{a}[0]? 23:55 @keyaki283 北区も通るんだ [in reply to keyaki283] 23:55 push @{$a->{a}}, @ abc; とpush @{$a->{a}}, …