2019-04-01から1ヶ月間の記事一覧

MeCab(めかぶ)の概要

MeCabは、京都大学情報学研究科、および日本電信電話株式会社コミュニケーション科学基礎研究所の共同研究ユニットプロジェクトを通じて開発された、形態素解析器のひとつ。パラメータの推定にCRF(Conditional Random Fields)を採用し、品詞体系, 単語長, 辞…

ライセンスと日本語訳のまとめ

■日本語訳をまとめてくれているページ ■必須・許可・禁止事項をまとめてくれているページ ■個々のライセンスの気になった話題 (1) Apache Licence ・でかい企業のOSSがApache License 2.0だと嬉しい理由 (2)GNU

JUMAN++の概要

JUMAN++は、京都大学の黒橋・河原研究室で開発された、形態素解析システムだ。 <デモページ> JUMANの改良版で、RNNLM(Recurrent Neural Network Language Model)という意味的に汎化された言語モデルを利用する。RNNLMは、単語を意味的に汎化したベクトルとし…

ChaSen(茶筌)の概要

ChaSen(茶筌)は、奈良先端科学技術大学院大学の松本研究室で開発された、入力文を単語単位に分割し品詞を付与するツールである。JUMANをベースに開発された。JUMANでは、形態素の連接コストを人手で定義していたが、茶筌では統計処理(HMM)によって自動的に連…

JUMANの概要

JUMANは、京都大学の黒橋・河原研究室で開発された、形態素解析システムだ。 UNIX系や、Windows(試験版。一部機能に制限あり)で動作するC言語で書かれたプログラムだ。2019年4月時点の最新バージョンは7.0だ。 解析に使用する辞書は、基本的な単語については…

systemd関連

■service のRHEL 7版 systemctl start サービス名 systemctl stop サービス名 systemctl daemon-reload systemctl -n 100 status サービス名 systemctl enable サービス名 systemctl is-enabled サービス名 systemctl disable サービス名 ■systemdのログレベ…

Apache Solrの基本的な構成

Apache Solr の基本的な使い方をまとめる。 ■Solrで検索ができるまでの作業順番 (DB操作と対比させてみよう) (1)コアの登録 (データベースを作るみたいなイメージ) (2)スキーマの登録 (データベース中にテーブルを作るみたいなイメージ) (3)ドキュメントの登…

Jettyの概要

■特長 100% Pure Javaの軽量サーブレットコンテナ。組み込みのWebサーバとしてもよく使用される。HTTP/2やWebSocketにも対応している。現在はEclipse Foundationで開発されている。軽量Tomcatと言ったところか。 ■ライセンス Apache License 2.0 と Eclipse …

Jettyについての目次

・Jettyの概要 ■ITとことんのトップページ ┗■本ページ

Apache Solrの概要

Apache Solr (アパッチ ソーラー)について調査する。 ■概要 フリーの全文検索エンジン。全文検索ライブラリであるApache Lucene(ルシーン)を使用している。 ■ライセンス Apache License 2.0 ■特徴 SolrにHTTPリクエストとして検索キーワードを投げ、検索結果…

形態素解析とかの目次

・Apache Solrの概要 ・JUMANの概要 ・JUMAN++の概要 ・ChaSen(茶筌)の概要 ・MeCabの概要 --------------------------------------- ■ITとことんのトップページ┗■本ページ

WireSharkでHTTP/2をパケットキャプチャする

WireSharkをインストールし、ブラウザでHTTP2でアクセスしている最中にWireSharkでパケットキャプチャしてみた。しかし、WireSharkのフィルタに "http2" と入力しても何も表示されない。そうだった! HTTP2は、TLSの上に実装されているんだった! 暗号化されて…