DelFusa Blog 総本山

プログラミングの話題とかです。

NEW | PAGE-SELECT | NEXT

≫ EDIT

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

| スポンサー広告 | --:-- | comments(-) | trackbacks(-) | TOP↑

≫ EDIT

Unicode、Delphi2009活用

みなさん。unicode対応Delphiを存分に活用しましょう。


     ∧,,∧   ヨットットットー
    ミ,, ゚Д゚ミ .  
    ミ  つ つ ))
     ミ ⊂.ミ
     ''∪''''

で、Unicodeの勉強のためにこちらどーぞ。

第2回:C#プログラムでサロゲート・ペアの動作を検証する(前編):ITpro
http://itpro.nikkeibp.co.jp/article/COLUMN/20080109/290600/


もちろん、DEKOさんのサイトも役に立ちまくりでしょう。
てくにっく&あるごりずむ。
http://homepage1.nifty.com/ht_deko/techalgo.html



昔、漏れはここで勉強しました。
UCS-2とUTF-8
http://homepage1.nifty.com/nomenclator/unicode/ucs_utf.htm




D2009からは、Delphiの文字列処理でも、モロにサロゲートペアの問題を抱えることになってきました。

んで、この記事みると.NETのStringInfoだとバイト毎の処理ではなく文字毎の処理を行えるようです。

これと同等のライブラリ、MECSUtilsを作っているDEKOさんはすごいな、早いし。
VCL標準だと、上記C#サイトと同様のことをするのがつらいわけでしょう。

日本人Delphiプログラマが全員で、文字列の長さを求めるコードを
自己構築している場合じゃないです。それを作ってくれててありがたいことっす。
D2009にはMECSUtilsは必須と言えるでしょう。

上記記事をみていて気がつきましたが、
文字列処理にもサロゲペアや結合文字が関係ないものと、関係あるものがありますね。
見極めなければいけません。

例えば、最近、漏れが構築しているソースコードとコメント除去ライブラリ。
あれはおそらく、サロゲペアは無関係。
WideString→Stringでほとんど大丈夫のはずですね。

Delfusaライブラリの構築も、基本的にIndexはバイト単位でおこなうのが自然みたい。
サロゲペアは2文字分として扱っちゃえばいいきがしてきています。

フルunicode化したDelphi。なかなか楽しみです。
移行するのもまた楽しそう。

MECSUtils リファレンス
http://homepage1.nifty.com/ht_deko/tech021.html#tech050


あと、totonicaさんのページもとても勉強になります。
Delphi 2009 特集
http://totonica.s41.xrea.com/doc/delphi_tiburon/index.htm


楽しく勉強していきましょう。

スポンサーサイト

| 未分類 | 23:01 | comments:0 | trackbacks(-) | TOP↑

COMMENT















非公開コメント

PREV | PAGE-SELECT | NEXT

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。