--------(--)

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

2012-02-26(Sun)

OS Xでnkfを使う





MacでRを使っているとき文字化けしたのでnkfを使ってコード変換した。
> txresDF <- NgramDF("001.txt", type=1, pos="名詞", N=3)

001.txtファイルが読み込めない。

EUC-JPへ変換する。
$ nkf -e --overwrite 001.txt
$ nkf -g 001.txt
EUC-JP


しかし、コンソールで
$ more 001.txt

で見るとまだ文字化けしている。

UTF-8へ変換する。
$ nkf -e --overwrite 001.txt
$ nkf -g 001.txt
UTF-8


その他のオプションは以下のとおり。
j(省略可能) : JISコード(ISO-2022-JP)を出力
-e : EUCコードを出力
-s : Shift-JISコードを出力
-w : UTF-8コードを出力(BOM無し)
-Lu : unix改行形式(LF)に変換
-Lw : windows改行形式(CRLF)に変換
-Lm : macintosh改行形式(CR)に変換
-g(--guess) : 自動判別の結果を表示
--overwrite : 引数のファイルに直接上書き
--version : バージョン情報を表示(インストール済チェック)


参考:
Mac OS X for Unix Geeks
すぐにできる! OS X Lion
関連記事
スポンサーサイト

コメントの投稿

管理者にだけ表示を許可する

コメント

プロフィール

kumagonjp2

Author:kumagonjp2
Python,Django,R,Mongo,MySQL,Struts,Spring,データマイニングなどサーバー関係のメモを残していきます。

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
雪が3Dで降るブログパーツ ver2

マウスで見る方向変えられます

検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。