日本综合一区二区|亚洲中文天堂综合|日韩欧美自拍一区|男女精品天堂一区|欧美自拍第6页亚洲成人精品一区|亚洲黄色天堂一区二区成人|超碰91偷拍第一页|日韩av夜夜嗨中文字幕|久久蜜综合视频官网|精美人妻一区二区三区

RELATEED CONSULTING
相關(guān)咨詢
選擇下列產(chǎn)品馬上在線溝通
服務時間:8:30-17:00
你可能遇到了下面的問題
關(guān)閉右側(cè)工具欄

新聞中心

這里有您想知道的互聯(lián)網(wǎng)營銷解決方案
超簡單Python漢字拼音轉(zhuǎn)換工具

將漢字轉(zhuǎn)為拼音,可以用于批量漢字注音、文字排序、拼音檢索文字等常見場景。

創(chuàng)新互聯(lián)主打移動網(wǎng)站、成都做網(wǎng)站、成都網(wǎng)站建設、網(wǎng)站改版、網(wǎng)絡推廣、網(wǎng)站維護、域名與空間、等互聯(lián)網(wǎng)信息服務,為各行業(yè)提供服務。在技術(shù)實力的保障下,我們?yōu)榭蛻舫兄Z穩(wěn)定,放心的服務,根據(jù)網(wǎng)站的內(nèi)容與功能再決定采用什么樣的設計。最后,要實現(xiàn)符合網(wǎng)站需求的內(nèi)容、功能與設計,我們還會規(guī)劃穩(wěn)定安全的技術(shù)方案做保障。

現(xiàn)在互聯(lián)網(wǎng)上有許多拼音轉(zhuǎn)換工具,基于Python的開源模塊也不少,今天給大家介紹一個功能特性最多的模塊:  pypinyin ,它支持以下特性:

  1. 根據(jù)詞組智能匹配最正確的拼音。
  2. 支持多音字。
  3. 簡單的繁體支持, 注音支持。
  4. 支持多種不同拼音/注音風格。
  5. 命令行工具一鍵轉(zhuǎn)化

1.準備

開始之前,你要確保Python和pip已經(jīng)成功安裝在電腦上,如果沒有,可以訪問這篇文章:超詳細Python安裝指南 進行安裝。

(可選1) 如果你用Python的目的是數(shù)據(jù)分析,可以直接安裝Anaconda:Python數(shù)據(jù)分析與挖掘好幫手—Anaconda,它內(nèi)置了Python和pip.

(可選2) 此外,推薦大家用VSCode編輯器,它有許多的優(yōu)點:Python 編程的最好搭檔—VSCode 詳細指南。

請選擇以下任一種方式輸入命令安裝依賴:

  1. Windows 環(huán)境 打開 Cmd (開始-運行-CMD)。
  2. MacOS 環(huán)境 打開 Terminal (command+空格輸入Terminal)。
  3. 如果你用的是 VSCode編輯器 或 Pycharm,可以直接使用界面下方的Terminal.
pip install pypinyin

2.基本使用

最普通的拼音轉(zhuǎn)化方法如下:

pypinyin  pinyin, lazy_pinyin, Style
pinyin()

識別多音字:

pypinyin  pinyin, lazy_pinyin, Style
pinyin(, heteronym=)

設置輸出風格,只識別首字母:

pypinyin  pinyin, lazy_pinyin, Style
pinyin(, style=Style.FIRST_LETTER)

修改音調(diào)輸出位置,在相應字母的后面顯示音調(diào),或者拼音的最后顯示音調(diào):

pypinyin  pinyin, lazy_pinyin, Style


pinyin(, style=Style.TONE2, heteronym=)



pinyin(, style=Style.TONE3, heteronym=)

不考慮多音字的情況:

pypinyin  pinyin, lazy_pinyin, Style
lazy_pinyin()

不使用v來代替ü:

pypinyin  pinyin, lazy_pinyin, Style
lazy_pinyin(, v_to_u=)

標記輕聲:

pypinyin  pinyin, lazy_pinyin, Style

lazy_pinyin(, style=Style.TONE3, neutral_tone_with_five=)

使用命令行一鍵識別拼音:

python -m pypinyin 音樂

3.高級使用

自定義拼音顯示風格

我們可以通過 register() 來實現(xiàn)自定義拼音風格的需求:

pypinyin  lazy_pinyin

pypinyin.style register


:
.format(pinyin)


lazy_pinyin(, style=)

可以見到,通過定義一個 kiss 函數(shù),使用 register 裝飾器,我們生成了一個新的 style,這個 style 可以直接被用于拼音的轉(zhuǎn)換參數(shù),非常方便。

另外,所有模塊自帶的 style 及其效果如下:

:



NORMAL =

TONE =

TONE2 =

TONE3 =

INITIALS =

FIRST_LETTER =

FINALS =

FINALS_TONE =

FINALS_TONE2 =

FINALS_TONE3 =

BOPOMOFO =

BOPOMOFO_FIRST =

CYRILLIC =

CYRILLIC_FIRST =

處理特殊字符

默認情況下,對于文字中的特殊字符會不做任何處理,原樣返回:

pinyin()

不過如果你想對這些特殊字符做處理也是可以的,比如:

ignore  : 忽略該字符

pinyin(, errors=)

errors? : 替換為去掉  \u  的 unicode 編碼:

pinyin(, errors=)

callable 對象?  : 提供一個回調(diào)函數(shù),接受無拼音字符(串)作為參數(shù), 支持的返回值類型:  unicode?或 list?或 None:

pinyin('你好', errors=lambda x: 'star')
# [['nǐ'], ['hǎo'], ['star']]

pinyin('你好', errors=lambda x: None)
# [['nǐ'], ['hǎo']]

返回值類型為 list時,會自動 expend list:

pinyin('你好', errors=lambda x: ['star' for _ in x])
# [['nǐ'], ['hǎo'], ['star'], ['star']]

# 指定多音字
pinyin('你好', heteronym=True, errors=lambda x: [['star', ''] for _ in x])
# [['nǐ'], ['hǎo'], ['star', ''], ['star', '']]

自定義拼音庫

如果你覺得模塊輸出效果不合你意,或者你想做特殊處理,可以通過  load_single_dict()? 或  load_phrases_dict()  以自定義拼音庫的方式修正結(jié)果:

from pypinyin import lazy_pinyin, load_phrases_dict, Style, load_single_dict
hans = '桔子'
lazy_pinyin(hans, style=Style.TONE2)
# ['jie2', 'zi3']
load_phrases_dict({'桔子': [['jú'], ['zǐ']]}) # 增加 "桔子" 詞組
lazy_pinyin(hans, style=Style.TONE2)
# ['ju2', 'zi3']

hans = '還沒'
lazy_pinyin(hans, style=Style.TONE2)
# ['hua2n', 'me2i']
load_single_dict({ord('還'): 'hái,huán'}) # 調(diào)整 "還" 字的拼音順序
lazy_pinyin('還沒', style=Style.TONE2)
# ['ha2i', 'me2i']

網(wǎng)站題目:超簡單Python漢字拼音轉(zhuǎn)換工具
分享路徑:http://www.dlmjj.cn/article/dpeohsh.html