[Tritonn-dev 29] Re: [Tritonn-dev] 文字正規化について

Back to archive index

Tetsuro IKEDA ikdtt****@gmail*****
2007年 11月 6日 (火) 02:20:40 JST


池田です。

そうですね、正規化はSenna側での処理となりますので、
Sennaの改造→Tritonnビルド時に改造版Sennaをリンク
というのが自然かもしれません。

もちろん実装(改造)パタンはいろいろあるとは思います。

MySQLに新しいSQL関数を追加実装するという点で言うと、
少し前にこんな文章をまとめました。
http://mirz.jp/mysqlext_sql_function.html

Tritonnの実装でいうとrevision9-13くらいのsvn diffを見ていただくと
kwic関数(開発時はsnippet関数)の実装例になります。

07/11/05 に Yutaro Shimamura<yu****@irx*****> さんは書きました:
>
> こんにちわ。島村です。
> 内容が変わるので、別subjectにしました。
>
> 文字正規化については
> Sennaの本体のlib/str.c内normalize_***内を改変する
> ことで
> 可能になるかと思います。
>
> 参考までに、sjisのカタカナをひらがなにするdiffです。
> カタカナ - > ひらがなにしてます。
>
> ヴ(0x8394)
> ヵ(0x8395)
> ヶ(0x8396)
>
> については変換していませんが。。
>
> これを適用することで、TritonnでSennaを使った
> SJIS全文検索の際に
> かたかな/ひらがなの正規化を行って検索することができると
> 思います。
> (インデックスの再生成が必要です。)
>
> ご参考になれば幸いですー。
>
>
>
>
> On Nov 5, 2007, at 11:05 PM, Mitsuo Yoshida wrote:
>
> > CEEK.JP の吉田です。こんにちは。
> >
> > ニュース検索などを運営しております。
> >
> > 上の方のレベルで ひらがな <=> カタカナ の
> > 正規化を行ったことがあり、その処理を
> > Tritonn に入れられないものかと思っています。
> > あとは、形態素解析に MeCab が使われているので、読み仮
> > 名で検索できると便利そうです。
> > 個人的には、位置情報に関する距離計算を MySQL の関数に
> > 起こすヒント(前記ももちろん)を得たくて ML に参加し
> > ました。
> >
> > どうぞよろしくお願いいたします。
> >
> > To: 池田 さま
> > Tritonn-dev も Senna-dev と同様に、タイトルがナンバリ
> > ングされると嬉しいのですが、いかがでしょうか?
> >
> >
> > ===== Ceek Technology ===================================
> >  吉田 光男 (Mitsuo Yoshida)
> >    Mail: info****@ceek***** / MSN Messenger: ceekz****@hotma*****
> >    Diary: http://private.ceek.jp/
> >    Web Sites:
> >      http://www.ceek.jp/
> >      http://news.ceek.jp/
> >      http://labs.ceek.jp/
> > =================================== Ceek Technology =====
> >
> >
> >
> >> こんにちは。池田徹郎(mir)です。
> >>
> >> いま十数名の方がこのMLにいるのですが、よかったら軽めの
> >> 自己紹介とかお願いできますか?
> >>
> >> 自己紹介だなんて恥ずかしい、、、という方はそれはそれで良い
> >> と思うの
> >> ですが、いきなり知らない人同士で話を始めるのもあれだと思い
> >> ますので。
> >>
> >> ちなみに僕は本名から過去の活動からいろいろwebに書い
> >> ちゃってるので
> >> このページとかを見ていただけると大体分かります。
> >> http://d.hatena.ne.jp/mir/about
> >>
> >> Tritonn開発はちょうど1年くらい前からやっています。
> >> もともとSennaのMySQLバインディングはSenna
> >> 開発者であるmoriさんらが
> >> 作ってメンテナンスされていたものを、引き継いだのがはじまり
> >> です。
> >>
> >> そんな感じで次の方どうぞー。
> >>
> >> _______________________________________________
> >> Tritonn-dev mailing list
> >> Trito****@lists*****
> >> http://lists.sourceforge.jp/mailman/listinfo/tritonn-dev
> >>
> >
> > _______________________________________________
> > Tritonn-dev mailing list
> > Trito****@lists*****
> > http://lists.sourceforge.jp/mailman/listinfo/tritonn-dev
>
> -------
> 島村 優太郎
> yu****@irx*****
>
>
>
> _______________________________________________
> Tritonn-dev mailing list
> Trito****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/tritonn-dev
>
>
>




Tritonn-dev メーリングリストの案内
Back to archive index