kzhr's diary

ad ponendum

移転記

はてなダイアリー廃止を機に移転してきました。

IDSをふくむテクストを一字づつ切り出すperlスクリプト

use strict; use warnings; use utf8; sub ids_split { my $text = shift; my @chars = split //, $text; my @split; my $buffer_text = ''; my $buffer_num = 0; for my $char (@chars) { if ($char =~ /[⿰⿱⿴⿵⿶⿷…

臨時仮名遣調査委員会議事速記録(1909)の著作権に関するおぼえがき

たとへば、国会会議録検索システム -FAQ-など。臨時仮名遣調査委員会議事速記録 - 国立国会図書館デジタルコレクションにあるが、文部大臣官房図書課だけの著作権を認めてよいのかはよく分からないところなので(あるいは個々に調べてあるのかもしれないが、…

「日本古典籍字形データセットをかんたんに分類してくれるPythonスクリプト」の結果を(手で)修正した量の統計を出すスクリプト

#!/usr/bin/perl use 5.012; use strict; use warnings; use utf8; use Cwd; use FindBin; use Data::Dumper; require "$FindBin::Bin/clgr.pl"; my $wd = Cwd::getcwd(); my @directories = clgr::scan_dir($wd); say join ",", 'Mat', 'U+ID', 'Total', 'E…

「日本古典籍字形データセットをかんたんに分類してくれるPythonスクリプト」の結果を修正してHTMLに再出力するスクリプト

#!/usr/bin/perl use 5.012; use strict; use warnings; use utf8; use Cwd; use FindBin; use Data::Dumper; require "$FindBin::Bin/clgr.pl"; my $now = time(); my $wd = Cwd::getcwd(); my @directories = clgr::scan_dir($wd); for my $dir (@director…

日本古典籍字形データセットをかんたんに分類してくれるPythonスクリプト

#!/usr/bin/python3 # coding: utf-8 # # Usage: Run on the directory just above where the Dataset of PMJT Character Shapes # (http://codh.rois.ac.jp/char-shape/) is downloaded # from pathlib import Path from time import time from PIL import …

pptx2md

#!/usr/bin/python #coding: utf-8 import sys from pptx import Presentation if __name__ == '__main__': prs = Presentation(sys.argv[1]) c = 1 for slide in prs.slides: print("# Slide " + str(c)) s = 1 for shape in slide.shapes: if not shape.ha…

Perlのregex?

正規表現でのメールアドレスチェックは見直すべき – ReDoS – yohgaki's blogを見て,Perl 5だとどうなるんだらうと書いてみた。ちなみに,perl 5.18.2とruby 2.0.0p648。 use strict; use warnings; use feature qw/ say /; use Time::HiRes qw/ time /; for…

非欧文中の算用数字を漢数字に置換してくれるかもしれないマクロ

Macでも使へるやうにとRegExpなしでやってみたものの,よくわからないエラーで動かなかったので動くのかもよく知らない。もっとすっきり書けるのではと思ふが,VBA初心者すぎてよく分らない。 Option Explicit ' ' Arabic2HanInJa by Kazuhiro Okada ' A mac…

外字を使ってWordデータを送ってきたときのこと

今後役に立つか分らないが,備忘までに。 状況 Office XMLなWordデータ EUDC.TTE + EUDC.EUF どっかの.TTFデータ ここでOffice XMLぢゃないとたいへんかも? 外字の使用場所がかんたんに分るなら可。今回は,論文で,縦横に使ってゐた(やめてほしい……)。 外…

Tue, Nov 20

23:24 ふつーにきまっとる: 【中国発】孫のネットショップのためにモデルを務めた72歳のおじいちゃんが意外にも大ブレイクしている件 | IRORIO(イロリオ) - 海外ニュース・国内ニュースで井戸端会議 http://t.co/3FZWDqDY 23:22 そういえば土日ひさびさに…

Mon, Nov 19

23:28 @funayamn @otamatic ねえ。 [in reply to funayamn] 23:24 @otamatic なんの笛で? [in reply to otamatic] 23:23 @koikekaisho じぶんの失敗をいつまでも持ち出すひとですか? けっこういますね^^;; あんまりしつこいと,相手に対して失礼にあたると…

Sat, Nov 17

14:18 o_o 14:18 RT @LustyNoise: 結局文章書けなかったが、一つだけ。松本総長がAERAの編集長との対談で語っていたが、はっきり言って「俺、日本人にしては教養あるって外国で褒められたんですよ」なんて言うような人間に僕はあまり教養を感じない。教養は…

Thu, Nov 15

21:04 @rhetorico なんとかxファイルは、Office XMLとかいうISOの規格になってるので、いちおう公知の事項のはずです [in reply to rhetorico] 20:59 ……田村だっけ? 20:59 RT @ishilinguist: 「谷亮子の旧姓ってなんですか?」←今日ジェネレーションギャップ…

Tue, Nov 13

23:48 @hidenosuke おいしいですよねー [in reply to hidenosuke] 23:42 なんか食べたいのあったなあと思ったけど,そうだ,横川の釜飯…… 23:40 RT @horuf: 今週末のもじもじカフェ番外編,人が集まらないの〜 誰か来て〜 貴重な映像が見られますよ〜 文字好…

Mon, Nov 12

23:43 RT @sho_n820: デザインって「正解」はないんだけど「これは違う」はあると思う。。だからコワイ。 23:42 @Mitchara 資料を傷める恐れのあるものは極力避けよということじゃないんでしょうか [in reply to Mitchara] 23:38 AはBと述べる。CはDだという…

Mon, Nov 05

23:48 @sugim 平和的解決! [in reply to sugim] 23:42 @sugim @jellyfish_chika それを押しのけるだけの熱意があるのかと思ってました(まがお [in reply to sugim] 23:27 @sugim よく分りませんがそんなに見たいならそこらへん歩いてる女性にお願いして見…

Sat, Nov 03

23:26 RT @ogawaissui: 私から言うのもなんですが、「完結したら買います」と言われましても、途中巻を買ってくださる読者がいなければ、当然打ち切りになります。 23:03 RT @takot: dqnplusとかkinisokuの記事で韓国・中国のことを語る人って何なんすかね。…

Fri, Nov 02

23:59 @carkuni そういえばそうで [in reply to carkuni] 23:57 前者は,もしアクセスするなら$a->{a}->[0]ってなるんかね。後者は$a->{a}[0]? 23:55 @keyaki283 北区も通るんだ [in reply to keyaki283] 23:55 push @{$a->{a}}, @ abc; とpush @{$a->{a}}, …

Thu, Nov 01

23:47 いま見返したところ,dvipdfmxにかけるまでやってくれるらしい 23:44 卒論をTeXで書いてたときはsh書いて自動化してたよ 23:43 @Mitchara できるはずですがw Windowsだと情報もいろいろ転がってそうですね [in reply to Mitchara] 23:42 @Mitchara バ…

Wed, Oct 31

23:19 RT @mhatta: 今日聞いたものも含めて最近の話を総合すると、今の日本は民間から役所まで、結局「その道のプロ」じゃない人が最終的な意思決定を握っていて、まあ間抜けなことをやる、というのが問題なんじゃないかなあ 23:09 @viewfromnowhere そもそ…

Tue, Oct 30

23:21 土曜の勉強会を木曜日にしたのだが,よく考えたらべつの勉強会も木曜なので確認したら,いちおう時間はずれて開催なので大丈夫だった。あぶない。 23:09 RT @Nakamura_Mitch: 内部のセミナーが一番厳しいというのが、あるべき健全な姿だと思います。一…

Mon, Oct 29

23:40 RT @zeeksphere: 天草版ポケットモンスター 23:40 amazonでケンコーコムから排水溝洗滌剤を買ったのだが,……「健康関連商品」なのだろーか 23:36 ばかーーーと言って走り去れるなら走り去りたいことままある 23:34 @sugim なるほどw 取り過ぎると鼻血…

Sun, Oct 28

23:54 正字というあやふやな概念についてちゃんと考えたいひとは,西原2012「唐代楷書字体規範からみた『竜龕手鏡』」石塚編『漢字字体史研究』勉誠出版 を読むべきである。いや,石塚先生の論攷も必読だけど,西原先生のほうが概念整理が分りやすい 23:50 R…

Sat, Oct 27

23:42 酔ったww 15:11 @NanashinoDoa おやつ? おやつならモリシアの地下にフードコートがあるよ [in reply to NanashinoDoa] 15:07 @NanashinoDoa なに食べたいの [in reply to NanashinoDoa] 15:05 @NanashinoDoa 津田沼駅の南にもあったかなー いまは知ら…

Fri, Oct 26

23:46 どうにかなるだろうというあまい想定がみごとにうらめにorz 23:45 まえの機械を返すまえに設定とか書き留めさせてもらえばよかったなあ。まさかこんなことになるとは 23:44 週が明けたらいーもばに電話しよう…… サポート料金発生するかもしれないが…… …

Thu, Oct 25

22:56 RT @msmsaito: フェミニズムの歴史と理論サイトに「ジェンダーギャップ指数は、適切な指標か」http://t.co/Q7PKcsI2をアップ。『社会運動の戸惑い』http://t.co/n8PA7LTnのステマw 22:55 ボケをかましているのではなく,変ってないだけなんじゃないの…

Wed, Oct 24

23:25 @hidenosuke 見出しはべつの明朝体なんですよね。いちおうプロ用の。謎です。。 [in reply to hidenosuke] 23:24 RT @ytb_at_twt: み「みなさまの税金を使っているという自覚が欲しい」 #研究者死亡かるた 23:24 @qitanocuma なにが?www [in reply to …

Tue, Oct 23

23:56 RT @stiwiih0429: 【定時】 新人「お先に失礼しまーす♪」 上司「おいおい、待てよ。周りを見ろ。まだ17時で、お前以外誰も帰ろうとしてない。どういう意味か分かるな?」 新人「えっと…僕以外全員無能ってことですかね?」 _人人人人人_ > ... 23:3…

Mon, Oct 22

23:50 なぜかリンクが張られている…… 23:50 O meu tio ? dentista. http://t.co/f40MWn7Q my uncle http://t.co/cSaZHafJ dentist ‘My uncle is a dentist.’ 23:08 RT @ui_nyan: 【北海道】若者が大麻でハロウィーンイベント開催 http://t.co/8vnpNCay 22:39…