kzhr's diary

ad ponendum

pptx2md

#!/usr/bin/python
#coding: utf-8

import sys
from pptx import Presentation

if __name__ == '__main__':
  prs = Presentation(sys.argv[1])
  
  c = 1
  for slide in prs.slides:
    print("# Slide " + str(c))
    s = 1
    for shape in slide.shapes:
      if not shape.has_text_frame:
        continue
      if s == 1:
        print("## " + shape.text_frame.paragraphs[0].text + "\n")
      else:
        for paragraph in shape.text_frame.paragraphs:
         print("  " * (paragraph.level) + "*"),
         print(paragraph.text)
      s = s + 1
    if slide.has_notes_slide:
      print("\n"),
      print(slide.notes_slide.notes_text_frame.text + "\n")
    c = c + 1

必要があって。

Perlのregex?

正規表現でのメールアドレスチェックは見直すべき – ReDoS – yohgaki's blogを見て,Perl 5だとどうなるんだらうと書いてみた。ちなみに,perl 5.18.2とruby 2.0.0p648。

use strict;
use warnings;
use feature qw/ say /;
use Time::HiRes qw/ time /;

for my $n (5 .. 12) {
  my $s = "username\@host" . ".abcde" x $n . ".";
  my $start = time();
  say $s;
  say $s=~ /\A([\w+\-].?)+@[a-z\d\-]+(\.[a-z]+)*\.[a-z]+\z/ms;
  say(length($s) . ': ' . (time - $start));
}

結果としては,

time perl test.pl

44: 0.000130891799926758

50: 0.0001068115234375

56: 0.000277042388916016

62: 0.000208139419555664

68: 0.000213861465454102

74: 0.000242948532104492

80: 0.00024104118347168

86: 0.000189065933227539

real	0m0.028s
user	0m0.017s
sys	0m0.008s
time ruby test.rb
nil
"44: 0.068262"
nil
"50: 0.385222"
nil
"56: 1.905355"
nil
"62: 9.483776"
nil
"68: 46.55787"
nil
"74: 230.308585"
nil
"80: 1156.772055"

real	24m5.527s
user	23m57.498s
sys	0m2.997s

といったところ。既知の結果ではありとくに云ふべきことないけれど,試してみるとほんとにぜんぜん違ふのは驚いた。

非欧文中の算用数字を漢数字に置換してくれるかもしれないマクロ

Macでも使へるやうにとRegExpなしでやってみたものの,よくわからないエラーで動かなかったので動くのかもよく知らない。もっとすっきり書けるのではと思ふが,VBA初心者すぎてよく分らない。

Option Explicit

'
' Arabic2HanInJa by Kazuhiro Okada
' A macro converts Arabic numerals in Japanese context into Han numerals
' Note that this macro converts entire file
' version 16 Oct 2017 Initial version
'

Sub Arabic2HanInJa()
' A main body
  Dim para As Paragraph
  Dim chr As Range
  Dim numFlag As Boolean
  Dim replFlag As Boolean
  Dim replBegin As Integer
  Dim replChr As Integer
  Dim chrNum As Integer

  For Each para In ActiveDocument.Paragraphs
    numFlag = False
    replFlag = True
    chrNum = 1
    For Each chr In para.Range
      With chr
        If .Text Like "[!a-zA-Z0-9 ]" Then
          If replFlag And numFlag Then
            For replChr = replBegin To chrNum
              para.Range.Characters(replChr).Text = _
                Arabic2Han(CInt(para.Range.Characters(replChr).Text))
            Next replChr
          Else
            replFlag = True
          End If
        Else
          If .Text Like "[0-9]" Then
            If numFlag = False Then
              numFlag = True
              replBegin = chrNum
            End If
          Else
            replFlag = False
          End If
        End If
      End With
      chrNum = chrNum + 1
    Next chr
    If numFlag And replFlag Then
      For replChr = replBegin To chrNum
        para.Range.Characters(replChr).Text = _
          Arabic2Han(CInt(para.Range.Characters(replChr).Text))
      Next replChr
    End If
  Next para
End Sub

Function Arabic2Han(num As Integer) As String
' A private function that converts Arabic numerals into Han
  Dim hanNumeral()
  hanNumeral = Array("〇", "一", "二", "三", "四", "五", "六", "七", "八", "九")
  Arabic2Han = hanNumeral(num)
End Function

外字を使ってWordデータを送ってきたときのこと

今後役に立つか分らないが,備忘までに。

状況

  • Office XMLなWordデータ
  • EUDC.TTE + EUDC.EUF
  • どっかの.TTFデータ

ここでOffice XMLぢゃないとたいへんかも? 外字の使用場所がかんたんに分るなら可。今回は,論文で,縦横に使ってゐた(やめてほしい……)。

外字データを画像データに変換する

今回のデータはわたしからさらに編集者に渡すものであったので,外字データがあるとよからぬことが起きないともかぎらない。そこで,外字データを画像にしてできるだけ埋め込みたい。

Googleで検索したところ,.TTEなデータは拡張子を.TTFにすればそのままPUAにグリフの割り当てられたTTFになることが分った。本機はMacなので,さうでないと困る(また,作業用のWinもないではないが,いろいろあって管理者権限は持ってゐない)。グリフを眺めたところ,デザインがひどかったが,時間もないので目を瞑る。またGoogleで,TTFから画像にできないか調べたところ,fontforgeのExport函数でできることが分った*1

どういふわけか,このままではまったく動かなかったのだけれど,このとほりにするといろいろ不都合があった。

  1. まづ,[Glyphs Worth Outputting]では,PUAにまんべんなくグリフがあるわけではないのに,PUA全体が選択されてしまふ。それは[Glyphs with only Splines]を選択することで解消された。
  2. つぎに,みつけたコードがうまく動かなかった。あれこれ試した結果,"Export("svg")"ならともかく出力することが分った*2
  3. しかし,それをそのまま画像化すると,文字の下が切れてしまふ。バウンディングボックスがなにか変らしい。さいしょはInkscapeをわざわざ入れてちくちく直してゐたが,200点ほどあるので自動化する必要があった。viewboxがどうもをかしいと分ったので*3,"perl -p -i -e 's/<svg viewBox="0 -145 1024 1024">/<svg viewBox="0 0 1024 1024">/;" *.svg"でどうにかする。
  4. ここまでくればmogrify*4。"mogrify -geometry 50x50 -format png *.svg"。ごちそうさまです。

なほ,どっかの.TTFデータも同様の手法で変換。こちらは*5この論文のためのものではなく,ぜんぶ扱ってしまふとまたよからぬことがあるので,どこで使用するか確認しなければならない。

Wordで使用した文字を確認する

.docxなwordデータは,zip圧縮されたファイルなので,解凍すれば中身が読める。あとはフォント名を頼りにリストアップ! がんばれ!!

できたデータをもとにperlで要らないファイルを消しました。ordが10進数で文字コードを返すのがゑぐかったです*6

Word XMLを書き換へる(失敗)

.docxなwordデータは,(中略)なので,画像を埋め込むのは難しくても,画像化したどのグリフを埋め込めばいいか分るやうにするくらゐの書き換へはできるんぢゃないかと思っていろいろやってみたが,どうにもうまくいかないのであきらめた。Mac OS Xだといらないファイルを勝手に付け足したりするので*7,それが原因なのかもしれないが,よく分らない。かといって,Wordではどの文字がどの文字コードかなど分らないので,XMLデータを眺めつつ,画像を埋め込むといふ非常にローテクなことをして作業完了。

*1:# Export all font elements to image with FontForge # # Usage # # 1. Open font wi - Pastebin.com

*2:いまにして思へば,"png"とかでもよかったのだらうか?

*3:"<svg viewBox="0 -145 1024 1024">"ってどういふことなのか。

*4:mognifyって覚えてた。謎w

*5:ひろく見れば外字データも使はない文字があるのだが

*6:ゑぐくはない

*7:Windowsがお行儀がばっちりなわけではないが,相対的に。

Tue, Nov 20

  • 23:24  ふつーにきまっとる: 【中国発】孫のネットショップのためにモデルを務めた72歳のおじいちゃんが意外にも大ブレイクしている件 | IRORIO(イロリオ) - 海外ニュース・国内ニュースで井戸端会議 http://t.co/3FZWDqDY
  • 23:22  そういえば土日ひさびさにやべせんせいにお目にかかったけれど,質問の発表への関連性がよく分らなかった
  • 23:18  寐れないときは換気扇の音もつらい。それくらいは分る。
  • 22:59  わたくしとしては譬喩でかんたんになるほどと言ってしまうひとがいちばん怖いけど,それはまあそれ。
  • 22:58  自然そのものが敵となり得るひとに,周囲の人間が配慮できることはやはり限られているので,赤ん坊を指して障碍者への人権侵害と言えるかはよく分らない
  • 22:56  @Mitchara 日本だと少なくとも近代的なパルプ製紙ができるまでないと思いますね  [in reply to Mitchara]
  • 22:54  @Mitchara へにゃりそうw  [in reply to Mitchara]
  • 22:53  ↓うーん
  • 22:53  RT @narniancat: おお、なるほど >飛行機の中で赤ちゃんの泣き声>立場を逆にして、「赤ちゃんの泣き声を生理的に受け付けない人間」というものについて考えてみると、見方は少し変わる。黒板を爪で引っかく音を想像してみるといい / “無題 - Dog e ...
  • 22:52  @Mitchara コデックスではむずかしそう  [in reply to Mitchara]
  • 22:51  そういえば,金曜の(金曜が固有名詞化しつつある)システムは,字体のラベル付けではなく,他文献に同様の字体があるかで分類させられるようにしたかったのだった。まあ,最初のシステムじゃむずかしいが,いまのだと書き方しだいか?
  • 22:36  @otamatic (おたまさんが)はげて動揺? 動揺はしませんね……  [in reply to otamatic]
  • 22:30  RT @miki__tan: スルーされたtweetは何度でも投稿する。何度でもだ。
  • 22:28  CiNii使わないと怒られる研究してるなら使ってないなら恥なのでは。そういう問題じゃないですか
  • 22:24  @otamatic はげどう  [in reply to otamatic]
  • 21:49  アフターセッションのあとジンギスカンだったんだ。まあ、知ってたとて行ったかは微妙だがw
  • 21:40  RT @theainz: お願いですから、店員さんに「このヴォジョレー何年もの?」とか「赤と白どっち?」とか聞かないでください。笑いをこらえるのが大変です。去年いてビックリしましたが、今年もいました。お願いです。お客の前で笑いをこらえるのが本当に大変なんです。お酒を扱う飲 ...
  • 20:50  @yearman @nv6283 @jellyfish_chika @met_loid @kisi_kune @sayunu @yalwai @tatann_ @qitanocuma @annabellely TwiFULL次回、12/12 or 12/13どちらがいいでしょう?
  • 19:29  がんばれ少年……!
  • 19:28  RT @okome_t: マクドナルドの高校生男女のさらに続き。女子「…ごめん…(泣きそう)」男子「えっ、いや、俺がごめん!?」女子「…」男子「…」女子「…私帰る」男子「えっ、あ、いや、でもバスまだ」女子「帰るね」男子「…うん、気を付けて…」〜そして帰る女子〜そして席で頭 ...
  • 19:28  RT @okome_t: マクドナルドで隣の席の高校生男女が、男子「なーお前彼氏いんの?」女子「えっ…」男子「え?」女子「○○君…」男子「何?」女子「○○君と私付き合ってるんじゃないの?」男子「お、俺?」女子「え、違うの?」男子「えっ」女子「えっ」という会話をしているので気まずい
  • 18:44  the view from nowhere : 2012-04-08 (Sun) http://t.co/ObMY5Bjz 「あくざわ」? 「たかーき」ってなんか前衛的
  • 17:57  RT @MnjaMnia: っていうか区割りなしの比例代表にすれば格差なくなるのに、むしろ比例代表減らそうとするw RT @kzhr: 国会の議員定員をどれだけ削ろうと、都会の票がかるいことに変りはないので、むしろ増やす方向に転じていただきたいのですが、なんかわけのわから ...
  • 17:53  大学でやってる勉強会もそんな感じ
  • 17:52  RT @tsujifolyam: @t_otoshi ここ数年、長居できるカフェで数名の読書会をやっています。夕方まで非常勤や出勤義務のある研究員をされている方が大半なので、月に1-2回、午後7時頃に集合して夕食+コーヒーで2時間くらいです。多少無理はありますが、場を持ち ...
  • 17:11  RT @tnatsu: 経産省IPA未踏スーパークリエータ認定証授与式。今年は6人のスーパークリエーターが認定される。プレゼンもよい。相変わらずベンチャーキャピタルが一社も来てない。アーリーステージとか言ってる割に未踏にすら来ていない素人日本VCは不要だな。
  • 16:44  RT @togiso: NAJAKS 2013 will be held in Bergen, Norway, on August 21-23, 2013 / “NAJAKS 2013 | NAJAKS - Nordic Association of Ja…” http: ...
  • 16:35  わたしなんぞ「その日いらい」とかも書くんだけど。
  • 16:34  ふだん、と仮名で書くことがふだんが和語であると思われているあかしになるであろうか
  • 16:26  RT @egamiday: 日本語で生まれるコンテンツを世界にひろげる責任は、日本にしかとれない。 #図書館総合展 #NCC ( #図書館総合展 live at http://t.co/95BRrdOv)
  • 16:25  @kisi_kune そういうことみたいですね: cf. http://t.co/17Jf9r1g  [in reply to kisi_kune]
  • 16:23  @nanaya_sac 選挙カーが有効な選挙は早く終ってほしいのは同意しますw  [in reply to nanaya_sac]
  • 16:15  @nanaya_sac 都市部の無力感も相当なものなので、やっぱり田舎の票が多そうですが、変るんですかね…… いろいろといい方向に行くといいんですが  [in reply to nanaya_sac]
  • 16:08  国会の議員定員をどれだけ削ろうと、都会の票がかるいことに変りはないので、むしろ増やす方向に転じていただきたいのですが、なんかわけのわからん理窟でがりがり削られてゆきますね
  • 16:06  @nanaya_sac まあ船橋市民で投票もしたことはあるので分りますw 船橋市を分割して二区にすれば重くはなるんでしょうが、定員削減のながれでまずありえないでしょうしねえ。  [in reply to nanaya_sac]
  • 16:01  @nanaya_sac あ、そうだったんですか(無知  [in reply to nanaya_sac]
  • 15:33  「検討してもよいのではないかと」というのは、ていねいかていねいでないかで言えば、ていねいだと思うのだが(平社員が社長に使えるわけではないでしょうが)、文中にていねいさを示す要素はない。これは言いさし形であるが、述語がていねいさも含めて想像可能なわけで、省略と言えないこともない?
  • 15:24  博士(文学、○○大学)
  • 14:18  @MnjaMnia 「おつきあいの問題」というのがもっとも適切なのではないかとさいきん。  [in reply to MnjaMnia]
  • 14:11  RT @MnjaMnia: ケースバイケースだけど、イライラする時って自分に余裕がないことが多い(睡眠不足の時とか)。だから実はこれってイライラする側の自己管理の問題だと思ってる(非難の理由は後付けのことが多い)。 RT @maiya226: …?みんな本当に赤ちゃんの泣 ...
  • 13:59  @Miraranran そういうわけじゃないのですが、そこが気になる方がおおいですね^^;  [in reply to Miraranran]
  • 13:58  @ab07_tact ふみ  [in reply to ab07_tact]
  • 13:57  @ab07_tact 煙草は-TOPだからヲとは決まってないんじゃ?  [in reply to ab07_tact]
  • 13:54  @ab07_tact どちらかというと態と格ですかね  [in reply to ab07_tact]
  • 13:53  RT @i_hasekura: wikipediaからやたら感謝状が来ると思ったら、寄付の金額一桁間違えてた(゜Д゜;;;)
  • 13:53  ぶっそうな: http://t.co/ZgOFBybl : 米メキシコ湾沿岸でイルカの射殺や刺殺相次ぐ 当局が調査 http://t.co/58Wl2VsW
  • 13:52  「煙草は法律で未成年の喫煙を禁止されている」がいけないのはまあしょうがないとして、「煙草は法律で未成年の喫煙が禁止されている」はおkか?
  • 13:16  @kisi_kune だれw  [in reply to kisi_kune]
  • 13:16  RT @goldentimes: ( ???)←がNOVAうさぎに見える話をしたら15歳に「NOVAうさぎってなんですか?」って聞かれたのでYoutubeでCM見せたら「昭和のCMセンスすげぇwwっw」って返ってきました。
  • 13:15  RT @endBooks: ”残念なことに、災害直後に「現場に行くのは男、陰で支える女」という旧来の性別役割分業が復活し、強化されてしまった。全国から駆けつけた災害ボランティアも「男は力仕事、女は炊き出し」と、機械的に班分けする傾向があった。” http://t.co/I ...
  • 13:14  S先生の4モーラ漢語の頭高率のたかさがどうも気になる 宮城のことばなのかな
  • 13:04  @kisi_kune 死兆かも分からんね  [in reply to kisi_kune]
  • 13:02  元2・供給ダメ
  • 12:55  いないはずのひとが通ったのはなんだったのか
  • 08:19  RT @ryoko174: 万人に移動する権利があることや、乳幼児は泣くものだという他者への想像力・理解に著しく欠ける大人の方が、泣き叫ぶ乳幼児よりもよほど迷惑でグロテスクだということをさかもと未明は自覚しては。 <再生JALの心意気/さかもと未明 http://t.co ...
  • 08:18  @nyaginagi 寝るなーwww いま歩くのがひとより早いのはあそこを毎日歩いてたからな気がするね  [in reply to nyaginagi]
  • 08:16  なんかまるで冬みたい
  • 08:10  高校のころはよく0806津田沼発千葉行きに乗ったなあ(幕張から走るコース
  • 06:43  RT @hyuki: [git]なにこれたのしい / “「githug」でgitの基本操作を算数ドリルみたいに学ぼう! | Act as Professional - hiroki.jp by HIROCASTER” http://t.co/dpJJRq4n

Powered by twtr2src

Mon, Nov 19

  • 23:28  @funayamn @otamatic ねえ。  [in reply to funayamn]
  • 23:24  @otamatic なんの笛で?  [in reply to otamatic]
  • 23:23  @koikekaisho じぶんの失敗をいつまでも持ち出すひとですか? けっこういますね^^;; あんまりしつこいと,相手に対して失礼にあたると思うのですが,なんとも。  [in reply to koikekaisho]
  • 23:16  わたくしは第三者なことではあるのだが,あるひと(A)のちょっとした失敗をいつまでも持ち出すひと(B)がいて(そのせいでBさんはすこしいやな思いをしたらしいのだが),じつは他人にはちょっとした失敗にしか思えなくとも,Bさんに取っては死ぬまで許さないようなことだったのだろうか
  • 22:45  RT @orionis23: 戸田山さんの「やたらとアンケートをとりたがる寿司屋」の話がおかしかった。「いまのシャリ、すっぱくなかったですか?大丈夫でしたか?」「いまの海苔、しけてなかったですか?」って、いちいち一貫握る度に聞いてくる寿司屋。授業アンケートを毎学期とるの、 ...
  • 22:42  間違った決断だとしても,そのときくらいは拍手をもらえることもある
  • 22:09  @sugim 言っても聞かないですしw 勉強する気も起きないなあ  [in reply to sugim]
  • 22:09  わかった、nvさんの元カノが結婚したんだ(
  • 22:02  @hidenosuke まあそういうのもありますね  [in reply to hidenosuke]
  • 22:02  @ab07_tact えー……  [in reply to ab07_tact]
  • 21:59  いっしょにご飯に行こうと誘われて行ったところに、留学生がじぶんたちのことばでずっと会話されていると、なんで呼ばれたのか不思議になる。
  • 21:51  RT @langstat: #1302. なぜ方言が存在するのか --- 系統樹モデルによる説明 - hellog〜英語史ブログ http://t.co/mS4ISnEF
  • 21:27  お米はまとまって買うから袋の値段が高いが、1回分で計算したら普通だろうと思うけど
  • 21:22  ちなみにわが家で3合炊くと6杯分ですが
  • 21:20  朝日新聞デジタル:エジプト・コプト教会に新法王 41年ぶりの就任式 - 国際 http://t.co/EhXDtSPo
  • 21:18  @udopan @yearman 高いかなあ?  [in reply to udopan]
  • 21:07  @MnjaMnia 正式名称を最後まで言うんです?  [in reply to MnjaMnia]
  • 20:54  @MnjaMnia おおう^^;;;  [in reply to MnjaMnia]
  • 20:54  @qitanocuma じぶんのもでしょw  [in reply to qitanocuma]
  • 20:52  個人的にはアーモンドクラッシュポッキーがポッキーの中でいちばん好きだと思う。
  • 20:51  RT @hkubota1016: 【緊急ポスト】レポートの結論部分を「個人的には」で始めるのは絶対にやめてください。
  • 20:51  千葉大学文学部文学科はわたくしが通ってたころにはすでにございませんで、千葉大学文学部日本文化学科に在籍しておりました。現在は北海道大学大学院文学研究科博士後期課程言語文学専攻に所属しております
  • 20:49  いぼじいさんおじょうさん説
  • 20:44  @p_typo 文学研究科はまあそこまで分離してないのでいいんですけど  [in reply to p_typo]
  • 20:42  @p_typo いまは理学院なんですね。そういえば工学も工学院……  [in reply to p_typo]
  • 20:41  @p_typo 理系のみなさまは教員組織と院生の所属組織が違ったりしてややこしいです  [in reply to p_typo]
  • 20:40  千葉大学文学部文学科がよかった(いつの時代
  • 20:39  北大、そんなひとつひとつの組織の名称は長くもないが(新設組織を除く)、大学院生は正式に書くと北海道大学大学院○○研究科○○課程になって長いのなんの
  • 17:58  保護下にあったとなるとあれではある……: 積丹岳遭難死 道に1200万円賠償命令 札幌地裁 「救助隊に過失」−北海道新聞[道内] http://t.co/jOTvzobM
  • 17:55  @stiidxa 若さと思い詰めのはやさは似ているけれどw  [in reply to stiidxa]
  • 17:51  @stiidxa わかいなー  [in reply to stiidxa]
  • 17:50  外国文学の人の訛りに対する偏見ってなんなんだろう
  • 17:44  27歳以下の人は「本当の寒さ」を体験したことがない? | Climate+ http://t.co/WafoYo0Y
  • 17:29  RT @mhatta: 「研究者コミュニティの「限界集落」化について」 http://t.co/HgLtWaxM
  • 17:27  某拓本画像をもらったので(違)、眺めている。折れ目もがんばってのばして撮影してあってすごい。
  • 17:20  RT @ottwo: マンションの掲示板にこんなん貼ってあった。これを読んで「なるほど!やめよう!!」と思う人がいるかどうか考える必要がある。 http://t.co/eZkS7732
  • 16:53  @knagasaki 先生のSAT講習会終った。おもしろかったし盛況だった。
  • 16:51  RT @DogRuskin: 学会のメンバー自体が高齢化しているというか、なぜか若手研究者があまり学会に所属しない・来なくなっている、といった傾向が私の周りにはあるようにも思ったり。 いや、むしろできる若手は国内学会よりも国際学会に行っているんですよね。 アイルランド研究 ...
  • 16:39  RT @__gfx__: [society] / “イギリスのRubyカンファレンスBritrubyが人種・性別差別問題で開催中止に | 秋元@サイボウズラボ・プログラマー・ブログ” http://t.co/58NIph8W
  • 14:36  RT @840xyz: 昔、大学の友達に俺が10分1000円カットの常連と言ったら、「金持ちっすねー!いつも10000円近く払ってるんですか?」って聞かれたけど、10分ごとに1000円じゃねーよ。リア充と自分は別世界の人間ということがよく分かった。
  • 13:56  改行がスペースと同等のものと扱われるのは,アルファベットにおける区切りがスペースだからだとは思う
  • 13:53  @zeeksphere 改行したHTMLのほうが軽いとは  [in reply to zeeksphere]
  • 13:26  名古屋めしとは
  • 13:26  RT @asahi_nagoya: 名古屋市の観光資源の知名度について尋ねた市の全国アンケートで、「なごやめし」が1位になりました。手羽先の「山ちゃん」や、みそカツの「矢場とん」など名古屋の有名店が相次いで東京に出店していることが一因とみられます。 http://t.co ...
  • 13:26  RT @GoITO: 鳥取とは別の自治体でマンガ系の事業をやりたいところから相談を受けたことがあったんだが(先方に迷惑がかかるといけないので名前は出さずにおきます)、「地域開発系コンサルをかませたくないんですよね?」と訊いたら「そうです」と即答されたことを思い出しました。
  • 13:25  @zeeksphere タブ記号も同様に半角スペースであるかのようにふるまいますし  [in reply to zeeksphere]
  • 13:25  @zeeksphere そういうことですね。  [in reply to zeeksphere]
  • 13:16  @zeeksphere 置換じゃなくて改行は伝統的に空白の一種です  [in reply to zeeksphere]
  • 13:08  なんか楽しくなってきたけど,締切りが近いのはべつのテーマ!
  • 13:06  仮名を切り出すときに始点と終点だけで記述できないかな
  • 12:57  東京ウィキメディアン会 http://t.co/HNqtNJru
  • 12:29  @jellyfish_chika スープでも煮込んでるんじゃない  [in reply to jellyfish_chika]
  • 12:02  @ok_aym たしかに,前後が分りにくいですねww  [in reply to ok_aym]
  • 11:55  後者は,きまった字体と字体のあいだで起るので共起関係を統計的に出せるだろう。そうすれば,前者も感覚的にではなく出せるので,ほとんどの字体の単離が可能になるはず。
  • 11:49  前者はわりとどうでもいい。後者が問題。
  • 11:49  連綿には2種類ある。まえの字体の勢いでできる連綿と,まえの字とつぎの字の筆勢の関わり合いによって生まれる連綿。
  • 11:46  金曜日は話さなかったけど,あの画像の切り方の特徴は,連綿があるばあいはできるだけそれを入れたことだと思う。画像と本文とのむすびつきはRDB的なので,あれに連綿のフィールドを付けくわえることじたいは問題がない
  • 11:01  もあ・おん・へんたいがな2。そのようなとき,変体仮名のコード化に発言権があるのは,教科書の異体仮名表であり,活字会社の異体仮名リストではないか。古体の仮名をコード化するのであれば,これらを取り入れるのは有害ですらある。
  • 10:59  もあ・おん・へんたいがな。変体仮名は,金曜日のレジュメに触れたようにあくまで標準の仮名というものがあるそれ以外のものでしかないが,前近代の標準的な書記(書きつづり)場面において,標準は存在しなかった。それゆえ,変体仮名と古体の仮名は区別されねばならない;
  • 10:56  @MnjaMnia いや,だいじょうぶですw  [in reply to MnjaMnia]
  • 10:40  RT @motokik: JS製のFlash Player。モジラはPDF ViewerもJSで作ってるし、JS代替の取り組みがすごいな。|mozilla/shumway @ GitHub http://t.co/AW0uVaHL
  • 10:39  RT @fukanju: 何にでもマヨネーズをつける人が『マヨラー』なら、何にでも酢味噌を付ける人は『スミソニアン』なのだろうか?
  • 10:39  @MnjaMnia 1枚目を開いたら自分でびっくりしましたwww  [in reply to MnjaMnia]
  • 10:38  連綿のなかにあったらどこからどこまでがその字か分らないでしょ,という批判は,個人的にはかってに克服された気になっていたのだが,考えてみてもそこに踏み込んだ研究はないので,やってみてもいいかなあとは思う。博論の前提にはならないので,優先度低め。
  • 10:37  RT @nkmr_aki: ところで、この「わかいあの肉」、「無理やり進行方向に合わせている」というより、「無理やり進行方向に合わせている」という感覚が最近強化されつつある、と言うのが正確だと思う。
  • 10:37  RT @pwta: どうして車に書く社名って、無理矢理でも進行方向に合わせようとするのだろう?だから時たま変なことになるw http://t.co/xPlQgXUP
  • 10:32  @MnjaMnia なるほど……w しかしそれはもともとの素材のよさもあるのではw  [in reply to MnjaMnia]
  • 10:22  @MnjaMnia 呪いは「本当の名前」じゃないと通用しないとか  [in reply to MnjaMnia]
  • 10:21  @MnjaMnia えw  [in reply to MnjaMnia]
  • 10:20  活用研究会って見るとSpecial Interest Group for Conjugationって思うよね
  • 10:17  販売担当者w
  • 10:16  RT @foooomio: 京都ヨドバシのディスプレイコーナー、同価格帯であるにもかかわらず、売り上げ1位のナナオFS2333とランク外の三菱RDT234WXにかなり画質の差があったので、背面を調べてみると、FS2333がHDMI、RDT234WXがD-Subに接続されて ...
  • 10:03  RT @rei013: 「無駄遣いするからお金なくなっちゃうんだよ?言ってることわかるよね?」と泣きながら両親に説教する男児がスーパーに現われ周囲の客が次々とカゴの中身を棚に戻すという珍現象が発生中
  • 10:01  RT @contractio: 無言RT @hazuma: 北田暁大氏のツイートを遡って読んだ。ぼくとは違う人生を選択し、学問的にも信条的にも遠くなってしまったと思っていた彼が、おもしろツイッタラーとして復活したこの奇跡を言祝ぎたい。いいじゃないか……!
  • 10:00  RT @masayang2010: 京大の人環・総人の問題についてのサイトが学外にも公開されたようだ。署名もできるようになっている。拡散希望とのことなので、RTなどよろしくお願いします。http://t.co/lUxNm9Br
  • 09:56  RT @tarareba722: 落ち込んだり気分が沈んだ時に一番ヤバい感情は「面倒くさい」だと思う。これにハマるとしんどい。食事する、ゆっくり風呂に入る、外出する、部屋を掃除する。そういうハードルが高くなる。狂気の作家、平山夢明氏は「面倒くさいは狂うスイッチ」と言ってい ...
  • 09:49  「もうかなり出したじゃん」(財務省)といわれる。
  • 09:48  RT @hahaguma: 大学院生が国会要請/学費年50万円・負債1000万円に/「負担の軽減・奨学金充実」 http://t.co/Lkvl5W7s「異常に高い学費、特異な貸与型奨学金など世界的にも遅れている。教育に予算を使うことは、個人に使うのではなく、国の発展のためです」
  • 08:57  RT @GenYamaguchi: とはいっても租税条約の趣旨〜租税条約がない場合は、同一源泉・同一支払いの所得について二重課税が発生する可能性がある。その場合は外国税額控除で処理する〜を知らないこと自体は嘲笑の理由にはならない。よく知らん話しを取りあげて、すぐに外国人優 ...
  • 08:46  RT @326u3: 衆議院解散の時期を見誤りシナリオが狂ったんだろう 【朝日新聞】維新と太陽?腑に落ちない合流だ http://t.co/nzO3PH0y #社説リーダー

Powered by twtr2src

Sat, Nov 17

  • 14:18  o_o
  • 14:18  RT @LustyNoise: 結局文章書けなかったが、一つだけ。松本総長がAERAの編集長との対談で語っていたが、はっきり言って「俺、日本人にしては教養あるって外国で褒められたんですよ」なんて言うような人間に僕はあまり教養を感じない。教養は別に見せびらかすものでも相対化 ...
  • 14:18  RT @orita_hikoichi: しかし、独立行政法人の大学学長の暴走で、大学教育が崩壊したとしても、たぶん、学長の責任を問う手段がない。だいたい、リコール制度すらない。こんな総長の出現を全く想定していない制度欠陥です。
  • 14:16  @langstat ぜひぜひ  [in reply to langstat]
  • 13:18  @hiratalie あとで先生に「席外しすぎ」とたしなめられてしまい^^;  [in reply to hiratalie]
  • 12:36  世の中には他人を振りまわすのだけがたのしいひともいるってことよね(唐突
  • 12:35  お金はもろもろどうにかなりました
  • 12:35  @langstat さんに御挨拶したいけど、懇親会いらっしゃるのかしらん
  • 12:03  機械彫刻用標準書体の「ゑ」 | yasuokaの日記 | スラッシュドット・ジャパン http://t.co/M3c3UHhD
  • 11:51  RT @odg67: @motoakihara 「御論文拝読しました。こういう何の役に立つのかわからない思想史研究、わたしも結構好きです」というお手紙をもらったことがあるのですが、これは判断に困る事例。
  • 11:46  けっきょく小木曽先生・小林先生@langstat ・山崎先生の発表を聞きにいった
  • 10:00  @ab07_tact あ、って、同じこと言わないでください  [in reply to ab07_tact]
  • 09:58  担当がなく本部詰めなので会場に聞きに行けない
  • 09:57  @ab07_tact えええ  [in reply to ab07_tact]
  • 09:54  RT @arg: 解散総選挙のいまこそ、政治はベストではなく、ベターな判断で行われるのが、まだましであることを認識したい。
  • 09:50  懇親会費用が250円足りない←
  • 09:46  @MnjaMnia ありますよー  [in reply to MnjaMnia]
  • 07:30  もう12月の予定を話す時期なんだなー
  • 07:21  あいにくの雨にございます
  • 06:43  書けばよかったかなーと思うのは,仮名字体の伝播モデルに「表層の疫学」的なかんがえかたを導入するといいんじゃないかなーというはなし。『表層の疫学』を読んだのは数年前なので記憶が怪しいけど!ww
  • 06:39  異体仮名の定義は書いてあるので読み落しではないかと思うけれど,ブロック体・草体化函数は書いてないですね。まあ,草体化函数はそういうものを考えでもしないと説明できないということで出してきたので,定義なんかしても紙幅のm(ry
  • 06:20  @MnjaMnia まったくないと昨日は申しましたが,よくよく考えてみれば,これが進藤氏の論文集に再録されたときに,「まいにちひらかなしんぶんし」の一部が変体仮名に変ってましたので,唯一例ということでw http://t.co/6qm5VFQU  [in reply to MnjaMnia]

Powered by twtr2src