7-46 新浪微博热门话题 (30分)

Posted 8023spz

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了7-46 新浪微博热门话题 (30分)相关的知识,希望对你有一定的参考价值。

新浪微博可以在发言中嵌入“话题”,即将发言中的话题文字写在一对“#”之间,就可以生成话题链接,点击链接可以看到有多少人在跟自己讨论相同或者相似的话题。新浪微博还会随时更新热门话题列表,并将最热门的话题放在醒目的位置推荐大家关注。

本题目要求实现一个简化的热门话题推荐功能,从大量英文(因为中文分词处理比较麻烦)微博中解析出话题,找出被最多条微博提到的话题。

输入格式:

输入说明:输入首先给出一个正整数N(≤),随后N行,每行给出一条英文微博,其长度不超过140个字符。任何包含在一对最近的#中的内容均被认为是一个话题,输入保证#成对出现。

输出格式:

第一行输出被最多条微博提到的话题,第二行输出其被提到的微博条数。如果这样的话题不唯一,则输出按字母序最小的话题,并在第三行输出And k more ...,其中k是另外几条热门话题的条数。输入保证至少存在一条话题。

注意:两条话题被认为是相同的,如果在去掉所有非英文字母和数字的符号、并忽略大小写区别后,它们是相同的字符串;同时它们有完全相同的分词。输出时除首字母大写外,只保留小写英文字母和数字,并用一个空格分隔原文中的单词。

输入样例:

4
This is a #test of topic#.
Another #Test of topic.#
This is a #Hot# #Hot# topic
Another #hot!# #Hot# topic
 

输出样例:

Hot
2
And 1 more ...

flag标记#出现,只记录每对#之间的字符,对于非英文数字字符换成空格,开头结尾都不能有空格且词间空格只有一个。
代码:
#include <cstdio>
#include <iostream>
#include <cstring>
#include <map>
#include <algorithm>

using namespace std;
char s[150],ans[150],ch;
int n,num,mnum;
map<string,int> mp;
int main() {
    scanf("%d",&n);
    getchar();
    for(int i = 0;i < n;i ++) {
        int c = 0,flag = 0;
        map<string,bool> tnum;
        while((ch = getchar()) != 
) {
            if(flag == 1) {
                if(ch == #) {
                    flag = 0;
                    while(c && s[c - 1] ==  ) c --;
                    s[c] = 0;
                    if(!c) continue;
                    c = 0;
                    if(!tnum[s]) {
                        mp[s] ++;
                        if(mp[s] > mnum) {
                            num = 1;
                            mnum = mp[s];
                            strcpy(ans,s);
                        }
                        else if(mp[s] == mnum) {
                            if(strcmp(s,ans) < 0) strcpy(ans,s);
                            num ++;
                        }
                    }
                    tnum[s] = true;
                }
                else if(isalnum(ch)) s[c ++] = tolower(ch);
                else if(c && s[c - 1] !=  ) s[c ++] =  ;
            }
            else if(ch == #) flag = 1;
        }
    }
    ans[0] = toupper(ans[0]);
    printf("%s
%d
",ans,mnum);
    if(num > 1) printf("And %d more ...",num - 1);
    return 0;
}

 

以上是关于7-46 新浪微博热门话题 (30分)的主要内容,如果未能解决你的问题,请参考以下文章

新浪微博热门评论爬虫采集

《新浪微博自动评论软件·设计与实现之热门评论篇》

使用echarts制作的类是于新浪微博热搜榜话题图谱效果。

Android 自定义view-仿新浪微博#话题#插入EditText

新浪微博热门评论抽取规则

新浪微博客户端(55)-高亮显示微博内容中的昵称,话题,超链接