タグ「自然言語処理」のすごいエントリーRss

情報検索の分野でよく使われるアルゴリズムで「TF/IDF」というものがあります。 ドキュメントの中から「特徴語」を抽出する、といったような用途でよく使われています。 TF/IDFアルゴリズムのくわしい解説はこことかここを見てください。 今回はこのTF/IDFの計算を「簡単」に実現するためのperlモジュールをCPANに上げましたので、ご紹介します。なまえはLingua::JA::TFIDFといいます... 続きを読む
3 コメント   このエントリーを含むはてなブックマーク このエントリーのブックマーク数
【研究部門長 関口 智嗣】メディアインタラクショングループ【研究グループ長 浅野 太】後藤 真孝 主任研究員と緒方 淳 研究員らは、ユーザーが協力すると日々性能が向上する音声情報検索技術を開発し、インターネット上にある日本語の音声データ(ポッドキャスト)を対象とした全文検索サービス「PodCastle(ポッドキャッスル)」(http://podcastle.jp)を2008年6月12日に一般公開し、実... 続きを読む
5 コメント   このエントリーを含むはてなブックマーク このエントリーのブックマーク数
<?xml version="1.0" encoding="UTF-8"?> <ResultSet xmlns="urn:yahoo:jp:jlp:JIMService" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="urn:yahoo:jp:jlp:JIMService http://jlp.yahooapis.jp/JIMService/V1/conversion.xsd"> <Result> <SegmentList> <Segment> <SegmentText>きょうは</SegmentText> <CandidateList> <Candidate>今日は</Candidate> <Candidate>きょうは</Candidate> <Candidate>教派</Candidate&g... 続きを読む
23 コメント   このエントリーを含むはてなブックマーク このエントリーのブックマーク数
和歌山大学がセカンドライフ内に開設する「言語バリアフリールーム」。中国語を話す人と、京都の文化について会話している[画像のクリックで拡大表示] 多文化共生センターきょうとが発表した、多言語による医療受け付け支援システム[画像のクリックで拡大表示]  日本語でチャット画面に「こんにちは」と書き込めば、ネットの向こうにいるフランス人の友人の画面には「Bo... 続きを読む
15 コメント   このエントリーを含むはてなブックマーク このエントリーのブックマーク数
「とりあえず寝起きドッキリ〜」 「雨だね~」 「関ジャニ 寝起きドッキリ」 「やっちまったよキリコさん」 「疲れるー」 「DVD「47」」 「えー、無事。」 「48」 「ごめんね、むちゃぶり」 「止まらねぇ!!!!!」 「あー」 「関ジャニ∞『47』☆寝起きドッキリ!」 「47」 「むふふふふ」 「グッズ詳細」 「寝起きドッキリ」 「47 ?」 「「47」DVD 届きました!!... 続きを読む
37 コメント   このエントリーを含むはてなブックマーク このエントリーのブックマーク数
「Googleキラー」とうわさされる自然言語検索エンジンPowersetの初のパブリックデモを見てきた。サンフランシスコのApple Storeなどの近くのそれほど大きくないバーに400人以上が集まり、かなりの熱気だった。 僕も実際にデモ機で検索をさせてもらった。まだデモなので、インデクス対象は英語Wikipediaのみ。かつ、検索パターンは「XXはなんと言ったか?」というものだけという制限... 続きを読む
0 コメント   このエントリーを含むはてなブックマーク このエントリーのブックマーク数

[PR]ブログのペットがお留守番