不断的学习技术 积累
时刻记录下工作,学习中的点点滴滴.
博客园
社区
首页
新随笔
联系
管理
订阅
随笔- 58 文章- 2 评论- 61
置顶随笔
[置顶]让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
摘要: 我利用了吕震宇根据Free版ICTCLAS改编而成.net平台下的ICTCLAS,把ICTCLAS的分词为lucene所用。以下是我写的程序,比较简单。大家看看评评,有什么要改进的地方,望大家指出Analyzer类:1usingSystem;2usingSystem.Collections.Generic;3usingSystem.Text;45usingLucene.Net.Analysis;6...
阅读全文
posted @
2007-12-12 14:30
harry.guo 阅读(3016) |
评论 (10)
|
编辑
[置顶]搜索引擎--文件索引设计
摘要: 因项目需要,文件索引的设计为了方便搜索引擎在取得文档进行切词后分析形成的文件索引。我发了我的设计上来让大家看看。我知道还有很多不对和考虑不到的地方,麻烦各位兄弟姐妹们多评评,提高宝贵意见。谢谢大家。大家狠狠的砸砖吧!文件索引设计索引文件采用倒排档结构,建立数据库表(三个索引表)一级索引表1、一级索引表按词曲中的首字母分N个扩展表,如A—G为一个表;H—N为一个表;O—W为一个表。2、一级索引文件属...
阅读全文
posted @
2007-09-14 18:14
harry.guo 阅读(2676) |
评论 (7)
|
编辑
2009年5月25日
正则在FireFox和IE下使用test的不同
摘要: 今天同事遇到这样的问题,查明原因.记下:由于FireForx和IE的执行javascript的引擎不同,所以会有些不同。以下的例子<script language="javascript" type="text/javascript">function fun(){document.write(/a/gi.test("a"));}fun()fun()</script>在IE...
阅读全文
posted @
2009-05-25 15:32
harry.guo 阅读(75) |
评论 (1)
|
编辑
2009年5月21日
格式化日期输出
摘要: 封装方法//格式化日期yyyy-MM-dd-mm-ss-q-S 如date.Format("yyyy/dd") Date.prototype.Format = function(format) { var o = { "M+": this.getMonth() + 1, "d+": this.getDate(), "h+": this.getHours(), "m+": this.getMinut...
阅读全文
posted @
2009-05-21 14:42
harry.guo 阅读(31) |
评论 (0)
|
编辑
2008年12月29日
知识:软件复杂度
摘要: 在硬件的可靠性设计中,有一条基本原则“简单就是可靠”。这个原则同样也适合软件,与功能的增多或增强相伴的是不断升级与补丁。现在已经有若干种软件复杂性的度量方法可供参考,其中McCabe QA是比较出色和实用的方法,它能够计算出多种软件复杂度,由此可对软件进行检查、分析和查明那些可能导致错误的代码。 复杂度 70年代,软件系统已经变得极其复杂,无论是开发还是维护都是一项成...
阅读全文
posted @
2008-12-29 15:22
harry.guo 阅读(159) |
评论 (0)
|
编辑
2008年12月8日
转:如何让你的SQL运行得更快
摘要: from:http://topic.csdn.net/t/20050311/11/3842756.html人们在使用SQL时往往会陷入一个误区,即太关注于所得的结果是否正确,而忽略 了不同的实现方法之间可能存在的性能差异,这种性能差异在大型的或是复杂的数据库 环境中(如联机事务处理OLTP或决策支持系统DSS)中表现得尤为明显。笔者在工作实践 中发现,不良的SQL往往来自于不恰当的索引设计、不充份...
阅读全文
posted @
2008-12-08 10:50
harry.guo 阅读(27) |
评论 (0)
|
编辑
2008年11月28日
白盒测试步骤
摘要: 先记录下简单步骤:第一步:画出控制流图第二步:计算圈图复杂度第三步:导出独立路径第四步:设计测试用例第五步:执行测试用例第六步:写测试报告
阅读全文
posted @
2008-11-28 16:01
harry.guo 阅读(97) |
评论 (0)
|
编辑
2008年10月17日
Ms时间处理收集
摘要: Sum聚合函数对DateTime数据类型字段进行求和统计求同一时间字段时间总和declare @t table(TimeLen char(8))insert into @t select '08:32:33'insert into @t select '00:00:06'insert into @t select '00:00:30'insert into @t select '00:00:13'...
阅读全文
posted @
2008-10-17 10:19
harry.guo 阅读(20) |
评论 (0)
|
编辑
2008年10月8日
[摘]javascript的Prototype实现和OO开发- -
摘要: 面向对象的JavaScript编程对于做过Web程序的人不应该是陌生,初期是用来做一些简单的FORM验证,基本上是在玩弄一些技巧性的东西。IE 4.0引入了DHTML,同时为了对抗Netscape的Javascript,提出了自己的脚本语言JScript,除了遵循EMAC的标准之外,同时增加了许多扩展,如下要提到的OOP编程就是其中的一个,为了命且概念,我以下提到的Javascript都是Micr...
阅读全文
posted @
2008-10-08 18:03
harry.guo 阅读(87) |
评论 (0)
|
编辑
2008年9月21日
java实现对文件的各种操作(转)
摘要: 各种操作挺全的:java中提供了io类库,可以轻松的用java实现对文件的各种操作。下面就来说一下如何用java来实现这些操作。新建目录<%@ page contentType="text/html;charset=gb2312"%><%//String URL = request.getRequestURI();String filePath="C:\\测试\\";filePa...
阅读全文
posted @
2008-09-21 12:37
harry.guo 阅读(124) |
评论 (0)
|
编辑
2008年8月26日
实现table跳转到指定行,并改变所在行的样式!
摘要: 有客户要求:对一个列表中的数据进行查询,查出的数据只需跳到那一行,并改个醒目的样式.我利用dhtml研究了一下,实现如下.记之以备后忘[代码]
阅读全文
posted @
2008-08-26 12:01
harry.guo 阅读(94) |
评论 (0)
|
编辑
2008年7月10日
关于WEB2.0的几个关键词
摘要: 关于WEB2.0的几个关键词:1. 博客(Blog)不仅仅是一个网络日记的技术工具,它的根本意义在于,它是互联网上赋予个人以力量的工具。博客就是网络社会化的“杀手级应用”,它让每个个人都可以成为互联网中自主的主体:呈现自己,表达自己并且与网络世界建立全面的交流沟通。随着网络对社会介入的日渐深入,可以毫不夸张的说,谁赢得博客,就会赢得信息全球化的主动权。现在,国与国之间的文化...
阅读全文
posted @
2008-07-10 18:00
harry.guo 阅读(51) |
评论 (0)
|
编辑
仅列出标题
下一页
公告
输入您的搜索字词
提交搜索表单
我的主页
个人资料
我的闪存
发短消息
<
2010年2月
>
日
一
二
三
四
五
六
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
9
10
11
12
13
搜索
常用链接
我的随笔
我的空间
我的短信
我的评论
更多链接
我的参与
我的新闻
最新评论
我的标签
我的标签
无缝滚动(3)
webwork (2)
css(2)
中文乱码(1)
getText(1)
多语言(1)
中文繁简体(1)
Global(1)
mysql(1)
tomcat(1)
随笔分类
(68)
ajax(1)
(rss)
c#(10)
(rss)
css(3)
(rss)
dhtml(8)
(rss)
j2ee(2)
(rss)
j2me
(rss)
java(6)
(rss)
javascript(6)
(rss)
linux(10)
(rss)
php(4)
(rss)
常用代码整理
(rss)
开源框架(5)
(rss)
软件测试(2)
(rss)
设计模式(2)
(rss)
数据库(6)
(rss)
我思我想(3)
(rss)
随笔档案
(58)
2009年5月 (2)
2008年12月 (2)
2008年11月 (1)
2008年10月 (2)
2008年9月 (1)
2008年8月 (1)
2008年7月 (1)
2008年6月 (5)
2008年5月 (12)
2008年3月 (4)
2008年2月 (2)
2008年1月 (8)
2007年12月 (4)
2007年10月 (1)
2007年9月 (5)
2007年8月 (2)
2007年7月 (1)
2007年5月 (1)
2007年3月 (3)
文章分类
(1)
摘抄(1)
(rss)
相册
我
收藏夹
(1)
技术收藏(1)
(rss)
积分与排名
积分 - 39541
排名 - 1896
最新评论
1. Re:让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
哈哈,看起来分的效果还有错。能给源码发一份给我学习一下吗? wangxuegang1214@163.com (Sky Wang)
2. re: 收藏:常用的广告代码的表达式
谢谢。。但是好复杂,难看懂 (发生副)
3. re: 我完成的C#关于在lucene下的中文切词
QQ:450452149
能不能联系我下,我也在研究这方面 (jianpu)
4. re: 正则在FireFox和IE下使用test的不同
用new RegExp也可以解决 (cloudgamer)
5. re: 让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)
能把源码给我一份吗,谢谢。
lintaoren123@126.com (任林涛)
阅读排行榜
1. 解决SecureCRT中文显示乱码(4244)
2. linux下使用rpm安装libxml2,gcc,gcc-c++等基本包(3821)
3. 我完成的C#关于在lucene下的中文切词(3448)
4. 让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)(3016)
5. 搜索引擎--文件索引设计(2676)
评论排行榜
1. 我完成的C#关于在lucene下的中文切词(19)
2. net2.0多语言网页的实现(16)
3. 让中科院中文分词系统ICTCLAS为lucene所用的简单程序(C#版)(10)
4. 搜索引擎--文件索引设计(7)
5. WebWork 2.1 / 2.2 与 Spring 集成方法总结(2)