9472a386.png






1: 2017/12/24(日) 19:32:30.13 ID:JAmCwJ/z0● BE:601381941-PLT(13121) ポイント特典
コンピューターで全漢字使用可に 6万字コード化

日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか
扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、
コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。

コンピューターで文字を扱うには、1つ1つの文字に、「コード」と呼ばれる世界共通の番号を割りふる必要がありますが、
日本語の漢字で、コードが割りふられているのは1万字だけで、コードが無く、コンピューターが扱えない「外字」は、
戸籍で使われているものをはじめおよそ5万字に上っています。

中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、
データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を
充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったり
するなどの問題が起きていました。

このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、
コードを割りつける作業を進めた結果、このほど15年越しでようやく完了し、国際規格として登録されました。

この結果「日本語の壁」の1つが取り払われ、外字が使われた名前を正確に表示できたり、地名を含むビッグデータを
正確に分析できたりするなどの効果が期待されています。

IPAの田代秀一参与は「日本人にとって、名前は大事なアイデンティティーで、戸籍では尊重されているがコンピューターが
追いついていなかった。文字を正確に扱えるようにすることは、今後ますます重要になる」と話しています。


https://www3.nhk.or.jp/news/html/20171224/k10011270111000.html




2: 2017/12/24(日) 19:33:10.63 ID:1B4bynNX0
さすがアップルやな、これからも一生アップル使うわ


3: 2017/12/24(日) 19:33:16.98 ID:+0iqOz260
吉野家はちゃんと書けるの?


4: 2017/12/24(日) 19:34:06.87 ID:ADdgEuTl0
その前にsjisとeucとutfを何とかして


5: 2017/12/24(日) 19:34:34.39 ID:dDxGM9hKO
さいとうさんとわたなべさんだけに朗報


7: 2017/12/24(日) 19:35:11.20 ID:eG4oDqE90
フォントは誰が用意するんだ?


19: 2017/12/24(日) 19:37:27.36 ID:yFdZ8/Xz0
>>7
なんか大変そうだよな


22: 2017/12/24(日) 19:38:16.42 ID:a7y1PqvO0
>>19
フォントはIPAフォントってのがすでに作成済みだったはず。


44: 2017/12/24(日) 19:47:20.23 ID:KGHpsw+70
>>7
用意してるだろ。
じゃなきゃ、さすがにコード割り振りだけで6万語に15年もかからん。


69: 2017/12/24(日) 20:02:20.97 ID:ZHixxYyk0
>>44
6万人のデザイナー雇えば数ヶ月で終わったんじゃ?


8: 2017/12/24(日) 19:35:17.23 ID:FMfFaCUQ0
もうUTF8だけで良くね?

9: 2017/12/24(日) 19:35:26.21 ID:a7y1PqvO0
UTF-8じゃなくて独自キャラクタセット?


10: 2017/12/24(日) 19:35:33.26 ID:PKItkQ0h0
中国の漢字は何文字あるの?


17: 2017/12/24(日) 19:37:12.49 ID:M5EhgwlT0
>>10
当然といえば当然だけど総数自体はたいして変わらん


11: 2017/12/24(日) 19:35:46.70 ID:iPWlb7CZ0
苗字旧字体だから助かるわ


12: 2017/12/24(日) 19:35:48.31 ID:M5EhgwlT0
それ以前に常用漢字とかいう糞制度を根本的に考えなおせ


13: 2017/12/24(日) 19:35:49.56 ID:Q+VTLOBt0
なべの辺じゃなかったんか


14: 2017/12/24(日) 19:36:08.47 ID:Rvu7LWqJ0
84画のこれもコード化したんか?
no title


24: 2017/12/24(日) 19:39:38.03 ID:zI17Wdf70
>>14
シューティングのキャラでしょ
これが3つずつヒューって落ちて攻めてくるんだよね?


59: 2017/12/24(日) 19:56:37.49 ID:ofcPRJma0
>>24
www

15: 2017/12/24(日) 19:36:39.73 ID:wemqGe0N0
Unicode埋め終わったんだ


16: 2017/12/24(日) 19:37:09.59 ID:AFeSba2S0
>渡辺」の「ベ」は「辺」「邊」「邉」など11種類、「斉藤」や「斎藤」の「サイ」は
「斉」「斎」「齊」「齋」などおよそ60種類

これ漢字を簡単なやつに統一したらいいじゃん
無駄なことを
漢字も時代とともに変遷してきて多様性ができてしまったのに
そのうちの一つにこだわるようなクソみたいなアイデンティティなんかステさせろ


25: 2017/12/24(日) 19:39:48.21 ID:M5EhgwlT0
>>16
おいおい言ってることがメチャメチャだな
変遷してきた多様性の結果がそういう表記違いだろ
統一しろってのは多様性の否定だけどお前の主張はどっちだよ


51: 2017/12/24(日) 19:51:21.03 ID:AFeSba2S0
>>25
漢字の多様性なんて使用者が間違って書いたりわざと変えて書いたものが
元は同じものなんだから統一しろって話
エントロピーは増大するんだから仕事によって元に戻す必要がある


18: 2017/12/24(日) 19:37:24.37 ID:w2368IcE0
Unicodeのユの字も出てないけどバカが書いた記事かな?


30: 2017/12/24(日) 19:41:21.53 ID:eG4oDqE90
>>18
NHKの一般人向けニュースだぞ


20: 2017/12/24(日) 19:37:51.25 ID:aBrzcYD90
>>1
戸籍を簡単な漢字に直せば良いだろwww
サイトーとかワタナベとか面倒臭すぎ
コイツラが変な拘り捨てりゃ良いんだよ


54: 2017/12/24(日) 19:52:47.18 ID:FUprDAwy0
>>20
コンピュータに人間が合わせろというのは昭和50年代の思想だぞw

21: 2017/12/24(日) 19:37:53.04 ID:Au1+Vg0i0
漢検一級に出てくるような漢字は廃止しろよ
変換したくても読めねーから面倒くせーよ


23: 2017/12/24(日) 19:38:29.39 ID:LfXOtTaM0
どうせデータ連携で化けるんだから余計な事しなくても
なきゃないで終わりなのに


26: 2017/12/24(日) 19:39:59.94 ID:RrvIlUnz0
しょうもない事に予算使うな


27: 2017/12/24(日) 19:40:02.47 ID:QUrXN0bm0
あれ、、1日15文字くらいのお仕事?


28: 2017/12/24(日) 19:40:21.49 ID:Jp6EfYB50
こんなバカげた文字に付き合わされる欧米人も大変だな


29: 2017/12/24(日) 19:40:48.37 ID:7lk4EkvqO
>>1
マジか漢字ROM増設だな!


31: 2017/12/24(日) 19:41:35.96 ID:7yqUuuIy0
草なぎも変換できるな


33: 2017/12/24(日) 19:42:04.85 ID:dJATDXTe0
コンピュータおばあちゃん〜


34: 2017/12/24(日) 19:43:13.95 ID:BvKtoIHE0
最近認印で正しい苗字のものが見当たらなくなってきた


35: 2017/12/24(日) 19:44:05.42 ID:ezxnPrY90
フォントデザイナーの災厄

36: 2017/12/24(日) 19:44:17.80 ID:luU06Ppq0
山のくねくね道って意味で峠があるので、山へんの代わりに金にして、金上下の漢字を作って欲しい。
当然読みはギャンブル。って意味で


38: 2017/12/24(日) 19:44:45.24 ID:d8yYWPJq0
2バイトに収まって良かったね


39: 2017/12/24(日) 19:45:08.03 ID:AAVKFMki0
よし、次はプログラムが認識してくれる1バイトの半角漢字を搭載してくれ
なおかつ見た目は細長くなくて、全角と同じように表示される奴な!


40: 2017/12/24(日) 19:45:09.32 ID:GAJRAkF30
山形にいたころ、「玉」の上の棒を取って「つち」と読む
苗字があったんだが、そんなのにも対応してんのかね。


41: 2017/12/24(日) 19:45:48.77 ID:WlhUghpj0
え?
これ既存データどうすんの?
やるの?
ヤダよヤダヤダヤダ


46: 2017/12/24(日) 19:49:35.83 ID:a7y1PqvO0
>>41
問題はそれだよな
SJIS外字領域で作った外字全部を
コード割り当てしなきゃいけないの気が遠くなるわ


49: 2017/12/24(日) 19:51:07.69 ID:KGHpsw+70
>>46
もちろん、コンバートライブラリも作っただろ。15年も税金使ったんだぜ?


62: 2017/12/24(日) 19:58:26.32 ID:a7y1PqvO0
>>49
だ、騙されないぞ!!
それにどうせコンバーター使ったって検証作業で泣くんだから…

42: 2017/12/24(日) 19:46:51.44 ID:KGHpsw+70
これは良くやった!と褒めてあげたい


43: 2017/12/24(日) 19:46:59.66 ID:jIHWZ1sQO
無駄な事に幾らかけたんだろうか


45: 2017/12/24(日) 19:48:56.15 ID:oeIk+ncu0
それでいつから使えるようになるんだ?


47: 2017/12/24(日) 19:49:56.51 ID:j0feavu10
昔TRONというのがあってだな…


48: 2017/12/24(日) 19:50:02.29 ID:GEDJ9G/x0
それより半角カナとかいう人類悪を早く根絶して欲しい。
あんなものは人道に反する罪で裁かれるレベルだ


53: 2017/12/24(日) 19:52:18.97 ID:ira+X7J/0
>>48
全角英数字はいいの?


68: 2017/12/24(日) 20:02:04.38 ID:cWuljro80
>>48
ポッキー


50: 2017/12/24(日) 19:51:19.20 ID:kKWrYEwV0
馬鹿じゃねえの


52: 2017/12/24(日) 19:51:53.60 ID:CD7VVLqt0
Windowsではいつから使えるの?

55: 2017/12/24(日) 19:53:00.66 ID:4KD4IWXw0
超漢字がないとは


56: 2017/12/24(日) 19:54:12.36 ID:gP6gnIa10
ソノマエニハンカクカナヲハイシシロ


57: 2017/12/24(日) 19:55:22.90 ID:53TLoaEA0
やったぜ!名前も常用漢字以外も付けられるようにして


58: 2017/12/24(日) 19:56:21.42 ID:awSHZnB80
4万文字格納している第4水準に+2万字?
第5水準になるの?


60: 2017/12/24(日) 19:56:53.20 ID:5gE6HO8y0
その点26文字で済むアルファベットは優秀だな


61: 2017/12/24(日) 19:57:01.51 ID:5YvbZiqz0
中国は漢字を簡略化する方向に進んでいるのに日本は逆行するのか?
姓は全部旧字で書く動きになって余計ややこしくなりそう。
元号と一緒、害悪でしかない。


63: 2017/12/24(日) 19:58:54.63 ID:7Nrprazz0
はしご高登録されるのか


64: 2017/12/24(日) 19:59:29.85 ID:HZCapToz0
常用漢字とか人名漢字とかの制限の方をきつくしてくれればそんな大事業は要らなかったんじゃないのか


65: 2017/12/24(日) 19:59:51.23 ID:SaxS7Jg00
ついに三国志ヲタの苦労が報われる日が来たか

66: 2017/12/24(日) 20:01:09.85 ID:Nfv5rN2i0
草なぎは?


67: 2017/12/24(日) 20:01:18.58 ID:ypgukzXC0
そもそもIMEが対応していないと変換できないに一票
コードの中にあっても候補として呼び出されないよね