网友回复
我写一个简单的中文分词js代码,可以根据这个来丰富和扩展。
以下是代码实现:
// 简单的中文分词函数 function chineseSegmentation(text) { // 简单的词典,可以根据需要扩展 const dictionary = [ "我", "你", "他", "她", "它", "们", "是", "在", "有", "和", "的", "了", "不", "这", "那", "都", "很", "到", "中国", "北京", "上海", "广州", "深圳", "学习", "工作", "生活", "喜欢", "朋友" ]; let result = []; let i = 0; while (i < text.length) { let matched = false; // 尝试匹配最长的词 for (let j = Math.min(text.length, i + 4); j > i; j--) { const word = text.substring(i, j); if (dictionary.includes(word)) { result.push(word); i = j; matched = t...
点击查看剩余70%