admin管理员组

文章数量:1530842

2024年3月4日发(作者:)

第25卷第4期 中文信息学报 Vo1.25,No.4 2011年7月 JOURNAL OF CHINESE INFORMATION PROCESSING Ju1.,2o11 文章编号:1003—0077(2011)04-0063-03 基于WAMP的藏汉英互译在线词典的设计与实现 周毛先,头旦才让,才让加 (青海师范大学藏文信息处理省部共建教育部重点实验室 青海省藏文信息研究中心,青海西宁810008) 摘 要:根据目前在线藏汉英词典使用的实际需求,青海师范大学藏文信息处理省部共建教育部重点实验室设计 实现了一种基于wAMP平台的藏汉英互译在线词典,并给出了词典数据库和查询页面的具体设计方法和关键代 码。经测试,该在线词典根据用户的需要,输入单字和词就可以在藏汉英三语问交互查询并快速检索到对应的译 词。词典采用B/S结构,它的实现有助于藏汉英三语间的交流和学习。 关键词:藏文;在线词典;WAMP;B/S结构;数据库 中图分类号:TP391 文献标识码:A Design and Realization of Tibetan-Chinese-English Online Dictionary Based on WAMP ZHOU Maoxian,Toudancairang,CAI Rangjia (Key Laboratory of Tibetan Information Processing of Ministry of Education(Qinghai Normal University) The Tibetan Information Research Center of Qinghai Province,Xining,Qinghai 810008,China) Abstract:According tO the actual demand of Tibetan—Chinese—English online dictionary,the key laboratory of Tibet an information processing of ministry of education designed and realized a Tibetan—rChinese—-English online dictionary which using WAMP as a design platform,and also gives out the specific design method and the main code of the the— saurus database and the query page.The experiment proved tha the the online dictionary can instantly return the correct trilingual words(Tibetan,Chinese and English)for the query entered by the customer.The dictionary is based on B/S structure,and its implementation is helpful for the communications and studies among Tibetan,Chi— nese and English. Key words:Tibetan;online dictionary;WAMP;B/S structure;database 词典的三种不同形式,三种形式的词典相互促进、相 1 引言 互发展,纸质词典成熟的编纂理论为电子词典和网 络词典提供了良好的数据资源和理论依据,从而促 从公元前7世纪亚述帝国编纂的苏美尔一阿卡 进了电子词典和网络词典的飞速发展,电子词典和 德语双语难词表开始,人们对词语的含义、性质、用 网络词典又凭借计算机技术和网络技术推广了词典 法等进行了详尽的注释,词典逐渐成为人们学习生 的应用。不同于纸质词典和电子词典,在线词典又 活中不可或缺的工具书,其中双语(多语)词典更为 具有操作方便、快捷、动态性好及更新快等优势,已 使用不同语言文字的国家和民族之间科技文化的交 经成为广大网络用户在学习语言、翻译语言和检索 流发挥了巨大的作用。随着计算机网络技术的飞速 信息等过程中查询对译词汇的主要途径_】]。 发展,传统意义上的词典已经不能满足人们的需求, 目前,虽与英文在线多语词典相比,汉语在线多 纸质词典、电子词典和网络(在线)词典已成为现代 语词典在质量和数量上都有较大差距,但是,汉语在 收稿日期:2011-04—15定稿日期:2011一O5—21 项目资助:国家自然科学基金资助项目(61063033);973计划前期研究专项(2o1OcB3347O8) 作者简介:周毛先(1988一),女,硕士生,研究方向为藏语计算语言学与机器翻译;头旦才让(1988一),男,硕士生,研究方 向为藏语计算语言学与机器翻译;才让加(1963一),男,教授,硕导,研究方向为藏语计算语言学、藏文信息处理。 

64 中文信息学报 线多语词典通过十余年来的迅速发展,已经初见规 模,形成了各具特色的在线词典资源,部分在线词典 已经商品化 。相较之下,藏文单语及多语在线词 典仍处于起步阶段,通过网络能够搜索到的藏文单 语或多语在线词典很少。近年来,随着时代的发展 和文化交流的深人,越来越多的国家、团体和个人对 藏族文化产生了浓厚的兴趣,藏语多语词典已成为 查阅资料和沟通交流的重要工具_2]。鉴于汉语是中 国通用语言而英语又是最流行的国际交流语言,建 立一个藏汉英三语词典就能基本保证其他语言与藏 语的互译。由于纸质词典存在查阅困难、便携性低、 更新周期长等困难,建立一个词汇量丰富、翻译准确 的藏汉英在线词典已成为必需。 2设计与实现 2.1 总体设计 为了方便用户查询词典,藏汉英在线词典采用 B/S结构,即浏览器/服务器模式,该模式容易扩展 系统并实现客户端的零维护,在线词典的开发平台 选用WAMP,用户查询流程如图1所示。 _口 客户端浏览器卜\\ 吾 嵌 —、 服 入 务 式 / 器 程 客户端浏览器卜.一 一 代 序 码 图1查询流程图 WAMP即基于Windows、Apache、MySQI 和 PHP的开放资源网络开发平台 ],w代表Win— dows操作系统;A代表Apache服务器,Apache作 为世界使用排名第一的Web服务器软件,几乎可以 运行在所有广泛使用的计算机平台上,由于Apache 是免费开源软件,所以不断有人来为它开发新的功 能和特性并修改原来的缺陷。Apache具有简单、快 速、性能稳定等特征,可作为在线词典的代理服务 器。M代表MySQL,由瑞典MySQL AB公司开 发,是一个小型关系型数据库管理系统,目前 MySQL被广泛地应用在Internet上的中小型网站 中,MySQL具有开源、体积小、快速、成本低等特 征,为了降低网站总体成本,选择了MySQL作为在 线词典的网站数据库。P代表PHP,是一个在网络 程序开发方面应用范围很广的语言,一般来说PHP 大多在服务器端运行,通过运行PHP的代码来产 生网页提供给浏览器读取,PHP可以在许多不同种 的服务器、操作系统、平台上运行,也可以和许多数 据库系统结合,使用PHP不需要任何费用,官方组 织PHP Group提供了完整的程序源代码,允许用户 修改、编译、 ‘充。 2.2词典数据库设计 本词典使用phpMyAdmin管理词典数据库。 phpMyAdmin是由php写成的MySQI 资料库系 统管理程式,方便管理员对词典数据库进行数据的 添加、编辑和删除等操作,使用phpMyAdmin叮以 导入已经建立好的外部数据表。 藏汉英词典数据表tbcna(表1)采用Unicode 编码,共有五个字段:C为汉文词;T为藏文例;E 为英文词;X为词性;A为ID,由于用户可能输入藏 文、汉文、英文三种语言的单词来查询,为加快对表 中记录的查找,建立了C、T、E三个字段的索引。 表1 藏汉英在线词典词条数据表结构 字段 类 长度 值 整 理 蜕 【月『 A DECIMAI 10.0 词条lI) X CHAR 4 utf8 unicode Ci 浏性标记 T CHAR 120 LItf8 unicode Ci 藏文渊条 (: CHAR 7O utf8 unicode Ci 汉文词条 E CHAR 80 utf8 unicode ci 英义刊条 对应在phpMyAdmin『f 输入的sql代码: CREATE TABI E tbcna ( C char(70)collate utf8 unicode cl default NU1 I , T char(12O)collate utf8 unicode ci default NULI . E char(80)collate utf8 unicode ci default NUI I . X char(4)collate utf8 unicode ci defauh NUI,I|, A decimal(1O,O)defallit NUI I , KEY C ( C ), KEY T ( T ), KEY E ( E ) )ENGINE—MyISAM I)EFAUI rr(:HARSET= ut{8 COI I ATE—utf8 unicode ci 将57 856条测试词条导入MySQI 数据库,为 数据安全考虑,通过phpMyAdmin对数据库进行加 密处理,浏览词条示例如表2。 2.3查询页面设计 用户进入在线词典的页面后,为r使.}}j户自由 

4期 周毛先等:基于wAMP的藏汉英互译在线词典的设计与实现 65 表2词条数据表示例 C ^\ T E X A 安培数 安培小时 ’ ’ £=: 1 ’嗣 ’ ’ amperage ampere—hour[AH,AMP—HR] 名词 名词 5O 51 安培小时计 碉截 司 ’ ’苗 { ’函 1 ampere—hour meter a.h.m] 名词 52 选择输入语言种类,方便用户在三语之间相互查找, 建 了可以 择查询语言种类的下拉列表框,包 ’ 、汉文或English三个选项,输入需要查询的单 词,就可以得到查询结果(图2)。 图2查询页面 查询页面php代码: 建立下拉列表框:  ̄span class一”style8”>请选择查询语言种类: <select mn1e一 sl size=”1 class一”style7 id= sl”>  ̄option value= 1 >汉文</option>  ̄option value= 2”> ’ </option>  ̄option va1ue一 3 >English</option> </select> </span> 当选择查询语言为藏文时: <?php errorreporting(0); ¥mac—isset(¥一POST[ mac ])?trim(¥一POST [ mac ]): ; ¥se一¥POST[ sl ]; ¥str=¥一GET[ A”]; ¥res—mysqiquery(”SELECT*FROM tbc— na WHERE C一” .¥mac. ); ¥rs—mysqlfetch—array(¥res); if(¥rs[ T ]!一 ) { echo¥rs[ X ]; echo <br><br> ; echo 汉文: .¥mac; echo”<br><br>”; echo 善气’ : .¥rs[ T ]; echo <br><bK>”; echo English: .¥rs[ E ]; ) else h。,没有对应的翻译!,; 、 ?> 2.4功能完善 为了更好的方便用户,丰富查询结果,提高交互 能力,还需做如下工作: 1)例句显示:将平行语料库添加到数据库,并 显示例句。比如输入单词“ ’ ”,不仅显示汉英 词汇等信息,还可显示语料库中包含该单词的句子 或短语,帮助用户更好的理解单词。 2)新词添加:查询单词时,如果词典数据库中 没有该词,系统允许添加新词,点击链接就可以创建 这个单词。由于现代藏文中出现越来越多的新词, 通过允许用户添加新词,可以及时更新词典数据库。 3)编辑解释:当用户对某个词条的解释不满 意,或者发现某个单词的解释信息或例句有错误时, 系统允许用户进行编辑并提交到数据库,由管理员 审核提交的内容,对数据库进行必要的修改,优化词 典库、语料库,为用户提供更好的翻译服务。 参考文献 [1]宋培彦,刘宁静.中英文在线词典浅析口].青岛酒店 管理职业技术学院学报,2009,1(2):38—41. 才藏太,李毛措.网络版班智达藏汉英电子词典的设计 fJ].计算机工程与应用,2005,41(17):126—128. 张瑞,高岭,王承博.基于WAMP动态维基网站的建 站方法[J].内江科技,2008,29(4):139,174. 叶晓菡.基于.NET的网络用语在线词典软件的设计 与实现[J].计算机时代,2010,(9):27—29. 才智杰,藏汉英电子词典的开发研究[J],青海师范大 学学报(自然科学版),2005,(2):48—50. 张锦文.国外在线语料库与在线词典管窥[J].广东广 播电视大学学报,2002,1I(3):72—75. 司敬新.在线词典的特点分析[J].中国电化教育, 2005,(2):84—85. 

本文标签: 词典用户数据库查询