ログインしてさらにmixiを楽しもう

コメントを投稿して情報交換!
更新通知を受け取って、最新情報をゲット!

Hyper Estraierコミュのxlhtmlの問題

  • mixiチェック
  • このエントリーをはてなブックマークに追加
今日mixiに参加させてもらえることが出来た友人少なめ、Follyといいます。よろしくお願いします。

さて、つい最近Hyper Estraierをしり職場にこっそり構築中なのですが、一つどうしてもうまくいかない問題があります。
xlhtmlを利用した.xlsのインデックス作成の時にどうしても
特定のファイルで「強制終了」を引き起こしてしまいます。

自分でxlhtmlをやってみると当該ファイルではbuffer overflowが起こるようです。
もう一つ完全フリーズ(?)になるファイルは最後にバイナリが返される??様な感じなのです。
(puttyputtyputty....とたくさん出力される)

何かお力添えいただけたら嬉しいです。


今のところ
.doc
.ppt
.xdw(DocuWorks
.xbd
.dwg(AutoCAD2000以下
.dxf
.pdf
でインデックス作成が出来るようになりました。

コメント(4)

答えられる人が居ないみたいですね…

メーリングリストに投げてみてはどうでしょうか?
http://lists.sourceforge.net/lists/listinfo/hyperestraier-users-ja
メーリングリストには参加させて貰っています。
今日何か一通きましたがutf-8の文字が見えるけれどなぜか正常にデコードされていないような様子。

Hyper EstraierのMLってどうしたらその他一般のMLのように化けずに使えるようになるのでしょう。

それも一つの悩みだったりします。(汗


それと、もう少し進展した状況で実は作者様へmail送ってしまいました。
ちょっとだけ進んだ報告。

正常にインデックス作成の出来ない.xlsファイルにはいくつか種類があるようで、buffer overflowを起こしてもestcmdが止まらないものもあります。

つまり、xlhtml単体を使って変換を標準出力するとbuffer overflowになってしまうものでもestcmdを通るものと(正しく登録できている意味ではないです)xlhtmlで正常に出力できる(HTMLとして正常)ものでもestcmdで強制終了になってしまうものがあるのです。


今回自分はギリシャ数字の入力されたexcelファイルをただ書き直すという簡単な作業をして上書き保存したところ、xlhtml自体はまともに動くようになったものがあります。
これがestcmdに使おうとすると止まってしまうのです。

xlhtmlがまだ正常に変換してくれないもの、
正常に変換されているはずのHTMLを渡しているつもりなのに止まってしまうestcmdと、悩みは広がってきました。

悩みのあるうちが楽しみどころと思って頑張ってはいますが、何かお気づきの点がございましたら、些細なことでも教えていただければと思います。
(インデックス作成時のログ作成方法とか)
平林さんにアドバイスをいただきまして、一応解決しました。
今回の問題ファイルはxlhtmlの暴走によりestcmdがとばっちりを受けてしまうものでした。
特に特定のファイルというものではなく、xlhtmlが連続して膨大な処理をすると難しいのかもしれません。(並列?

対策としては.xlsなので、
hyperestraier/filter/estfxmsotohtml内の
# output the result
case "$infile" in
の部分を
# output the result
ulimit -d 131072 -m 131072 -v 131072
case "$infile" in
としてメモリ制限をつけ、超えた場合はestcmdで切ってやることでestcmdがシステムに殺されてしまうのを防ぐということでした。

こうしておくと途中で終わってしまうものの、インデックスは破壊されません。


これまた今日発見した出来事。
変なxlsファイルが大量に処理されるとき、
-rw-r--r-- 1 root root 652288 2006-02-28 10:06 xcmd-in-00029669.xls
-rw-r--r-- 1 root root 652288 2006-02-28 10:11 xcmd-in-00029740.xls
-rw-r--r-- 1 root root 407804687 2006-02-28 10:06 xcmd-out-00029669.est
-rw-r--r-- 1 root root 407804687 2006-02-28 10:12 xcmd-out-00029740.est
の様な一時ファイルを残してestcmdがシステムに殺されてしまう状況になるようです。

工程表などをexcelで作るような習慣がある業種では気をつけてください(汗

ログインすると、みんなのコメントがもっと見れるよ

mixiユーザー
ログインしてコメントしよう!

Hyper Estraier 更新情報

Hyper Estraierのメンバーはこんなコミュニティにも参加しています

星印の数は、共通して参加しているメンバーが多いほど増えます。

人気コミュニティランキング