QPython实例01-获取所有短信并生成词云

Posted 2023-01-30 bushrose

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了QPython实例01-获取所有短信并生成词云相关的知识，希望对你有一定的参考价值。

一、QPython安装配置

1.1. QPython介绍

QPython是一个可以在安卓设备运行python的脚本引擎。版本有QPython 3L和QPython 3C，3L为官方版本，可以在应用市场搜索下载。3C版本为＂乘着船＂大佬的修改版本。由于3L版本有许多权限限制及很多包不能安装，文章中使用3C版本完成。

1.2. 下载地址

百度搜索"QPython 3C开源版"，进入gitee，找到链接即可下载，如下图:

百度网盘下载：https://pan.baidu.com/s/1zT1NGtYTe55m6bSRWlePRg
提取码：zxcv

帮助文档：https://www.bilibili.com/read/cv13322251

二、获取短信内容并生成词云

获取短信内容
获取短信将使用SL4A 的api，关于SL4A的介绍及文档，打开第一点gitee中相关链接，如下图：

话不多说，直接上代码：
获取所有短信并存入csv

import androidhelper
import csv

droid=androidhelper.Android()
# 获取短信具体内容并存入csv
def saveSMSToFile(save_path):
    # 获取所有收取的短信。False为获取所有短信，True为获取未读短信；inbox为收件箱，outbox为发件箱
    sms_data=droid.smsGetMessages(False, \'inbox\').result
    \'\'\'
    id：每条短信的原始id
    address：对方手机号
    date：短信息的时间戳
    body：短信具体内容
    read：已读未读，1为已读，0是未读。
    status不知道是啥
    type，发信息还是收信息，1为收，2为发
    \'\'\'
    headers=[\'_id\', \'address\', \'date\', \'body\', \'read\', \'status\', \'type\']
    
    with open(save_path,\'w\') as f:

        f_scv = csv.DictWriter(f, headers)

        f_scv.writeheader()

        f_scv.writerows(sms_data)

    return save_path

利用jieba分词及pyecharts生成词云


# 停用词，生成词云会过滤，根据实际情况修改
FILTER_WORDS = [\'你\', \'我\',\'他\',\'我们\', \'他们\', \',\',\'验证码\',\':\', \'的\',\'账号\', \'cn\', \'https\', \'0.00\', \'点击\', \'退订\', \'尊敬\',\'客户\', \'TD\', \'登录\',\'http\', \'12582\', \'61.56\', \'0.42\',\'u.10010\', \'http\', \'com\']


#获取关键词数量，用于词云展示时的数量，num可以修改，词云展示生成时的数量 
def getKeyWordsCounts(filepath, num=30):  
    with open(filepath,\'r\') as f:  
        f_csv=csv.reader(f)  
        headers=next(f_csv)  
        content=",".join([row[3] for row in f_csv])  
        #print(content)  
        seg_list=list(jieba.cut(content))  
        # print(seg_list)  
         
    keywords_counts = pd.Series(seg_list)  
    keywords_counts = keywords_counts[keywords_counts.str.len()>1]  
    keywords_counts = keywords_counts[~keywords_counts.str.contains(\'|\'.join(FILTER_WORDS))]  
    keywords_counts = keywords_counts.value_counts()[:num]  
    return keywords_counts


# 构建生成词云的元组  
def getWords(keywords_counts):  
    words=[]  
    for i, v in keywords_counts.items():  
        words.append((i,v))  
    return words


# 渲染html  
def render_html(html_filepath,words):  
    c = (  
        WordCloud()  
        .add(  
            "",  
            words,  
            word_size_range=[20, 100],  
            textstyle_opts=opts.TextStyleOpts(font_family="cursive"),  
        )  
        .set_global_opts(title_opts=opts.TitleOpts(title=os.path.splitext(html_filepath)[0]))  
        .render(html_filepath)  
)


# 生成词云  
def genWordCloud(csv_filepath,html_filepath, num=30): csv_filepath=saveSMSToFile(csv_filepath)  
    keywords_counts=getKeyWordsCounts(csv_filepath, num=30)  
    words=getWords(keywords_counts)  
    render_html(html_filepath, words)

传入文件地址及html地址

csv_filepath=\'/storage/emulated/0/0/sms.csv\'  
html_filepath=\'/storage/emulated/0/0/短信词云分析.html\'  
genWordCloud(csv_filepath, html_filepath)  
  
# 使用qpython自带的浏览器访问  
jsla(\'viewHtml\', html_filepath)

最终实现效果如下图：

完整版代码，点击底部阅读原文，回复【Qpython词云】

三、总结

文章采用Sl4A和QPython完成了短信词云生成。SL4A提供了丰富的api，如通过QPython结合scikit-learn监测并过滤删除垃圾短信等,这些都由大家自己去探索。

阅读原文

本文由公众号【产品经理不是经理】同步发布，欢迎关注

以上是关于QPython实例01-获取所有短信并生成词云的主要内容，如果未能解决你的问题，请参考以下文章

QPython实例02-调用其他app实例

Python爬虫小白教学篇：豆瓣9.3超高评分《觉醒年代》热评爬取生成精美词云！！！

Python爬取QQ空间好友说说并生成词云(超详细)

Python获取微信好友签名生成词云

使用python爬取App安卓应用商店评论并生成词云