ÀÖÓãµç¾º



½ÌÓýÐÐÒµA¹ÉIPOµÚÒ»¹É£¨¹ÉƱ´úÂë 003032£©

È«¹ú×Éѯ/ͶËßÈÈÏߣº400-618-4000

PythonÎı¾Êý¾Ý·ÖÎö£ºNLTKÓëjieba¸ÅÊö

¸üÐÂʱ¼ä:2022Äê11ÔÂ08ÈÕ10ʱ11·Ö À´Ô´:ÀÖÓãµç¾º ä¯ÀÀ´ÎÊý:

ºÃ¿Ú±®ITÅàѵ

¡¡¡¡NLTKÈ«³ÆÎªNatural Language Toolkit£¬ËüÊÇÒ»Ì×»ùÓÚPythonµÄ×ÔÈ»ÓïÑÔ´¦Àí¹¤¾ß°ü£¬¿ÉÒÔ·½±ãµØÍê³É×ÔÈ»ÓïÑÔ´¦ÀíµÄÈÎÎñ£¬°üÀ¨·Ö´Ê¡¢´ÊÐÔ±ê×¢¡¢ÃüÃûʵÌåʶ±ð(NER)¼°¾ä·¨·ÖÎöµÈ¡£

¡¡¡¡NLTKÊÇÒ»¸öÃâ·ÑµÄ¡¢¿ªÔ´µÄ¡¢ÉçÇøÇý¶¯µÄÏîÄ¿£¬ËüΪ³¬¹ý50¸öÓïÁÏ¿âºÍ´Ê»ã×ÊÔ´(ÈçWordNet)ÌṩÁËÒ×ÓÚʹÓõĽӿÚ£¬ÒÔ¼°Ò»Ì×ÓÃÓÚ·ÖÀà¡¢±ê¼Ç»¯¡¢´Ê¸É»¯¡¢½âÎöºÍÓïÒåÍÆÀíµÄÎı¾´¦Àí¿â¡£½ÓÏÂÀ´£¬Í¨¹ýÒ»ÕűíÀ´ÁоÙNLTKÖÐÓÃÓÚÓïÑÔ´¦ÀíÈÎÎñµÄһЩ³£ÓÃÄ£¿é£¬¾ßÌåÈç±í8-1Ëùʾ¡£

¡¡¡¡±í8-1 NLTKÖеij£ÓÃÄ£¿é

NLTKÖеij£ÓÃÄ£¿é

¡¡¡¡GitHubÉÏÓÐÒ»¶ÎÃèÊöJiebaµÄ¾ä×Ó£º

¡¡¡¡“jieba”(Chinese for “to stutter”)Chinese text segmentation£ºbuilt to be the best Python Chinese word segmentation module.

¡¡¡¡·­Ò룺“Jieba”ÖÐÎÄ·Ö´Ê£º×îºÃµÄPythonÖÐÎÄ·Ö´Ê×é¼þ¡£

¡¡¡¡Óɴ˿ɼû£¬jieba×îÊʺÏ×öÖÐÎÄ·Ö´Ê£¬ÕâÀë²»¿ªËüÓµÓеÄÒ»Ð©ÌØµã£º

¡¡¡¡(1)Ö§³ÖÈýÖÖ·Ö´Êģʽ£º

¡¡¡¡¡ô¾«È·Ä£Ê½£ºÊÓͼ½«¾ä×Ó×ȷµØÇпª£¬ÊʺÏÎı¾·ÖÎö¡£

¡¡¡¡¡ôȫģʽ£º°Ñ¾ä×ÓÖÐËùÓеĿÉÒԳɴʵĴÊÓﶼɨÃè³öÀ´£¬Ëٶȷdz£¿ì£¬µ«ÊDz»Äܽâ¾öÆçÒå¡£

¡¡¡¡¡ôËÑË÷ÒýÇæÄ£Ê½£ºÔÚ¾«È·Ä£Ê½µÄ»ù´¡ÉÏ£¬¶Ô³¤´ÊÔÙ´ÎÇзÖ£¬Ìá¸ßÕÙ»ØÂÊ£¬ÊʺÏÓÃÓÚËÑË÷ÒýÇæ·Ö´Ê¡£

¡¡¡¡(2)Ö§³Ö·±Ìå·Ö´Ê¡£

¡¡¡¡(3)Ö§³Ö×Ô¶¨Òå´Êµä¡£

¡¡¡¡(4)MITÊÚȨЭÒé¡£

¡¡¡¡jieba¿âÖÐÖ÷ÒªµÄ¹¦ÄܰüÀ¨·Ö´Ê¡¢Ìí¼Ó×Ô¶¨Òå´Êµä¡¢¹Ø¼ü´ÊÌáÈ¡¡¢´ÊÐÔ±ê×¢¡¢²¢ÐзִʵÈ£¬´ó¼Ò¿ÉÒԲο¼https://github.com/fxsjy/jiebaÍøÖ·½øÐÐÈ«ÃæÑ§Ï°¡£ºóÆÚÔÚʹÓõ½jieba¿âµÄijЩ¹¦ÄÜʱ£¬»áÔÙÁíÐе¥¶À½éÉÜ¡£

0 ·ÖÏíµ½£º
ºÍÎÒÃÇÔÚÏß½»Ì¸£¡
¡¾ÍøÕ¾µØÍ¼¡¿¡¾sitemap¡¿