考勤表格中多个时间,如何分别提取上下班时间?如何计算上班时长?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了考勤表格中多个时间,如何分别提取上下班时间?如何计算上班时长?相关的知识,希望对你有一定的参考价值。

考勤机导出的表格中,有上下班多次打卡时间,需要分别提取上午、下午的上班时间和下班时间。再分别计算多上午、下午上班时长。 如图所示。

参考技术A 考勤上面多了个时间。有可能是考勤表,打错了格式。你只要每天有四次的。上下班就可以了。 参考技术B 楼主您好,您说多个时间?您这是四个打卡时间啊,一般的公司四个打卡也算是正常的啊,有的是打两次卡,我没发现有什么错误,你这个提取上下班时间也很简单啊,你首先要根据公司的制度去判定,上午上班和中午下班迟到打上班卡和提前打下班卡是怎么规定的,是扣工时还是算迟到早退,明白这个了就知道怎么算了啊追问

大哥,要公式,理论出来,可是 我不知道怎么用公式做

追答

现在很少手动用公式算了,考勤软件就可以自动的处理各种班次时间段了

如何从表中提取上下文数据来训练自定义命名实体识别器?

【中文标题】如何从表中提取上下文数据来训练自定义命名实体识别器?【英文标题】:how to extract contextual data from tables to train custom named entity recognizer? 【发布时间】:2019-11-18 18:41:07 【问题描述】:

我有包含表格的文档,我想提取上下文信息(例如句子或任何其他形式),以便我可以标记它们并构建命名实体识别器。

有谁知道我们如何构建上下文训练数据来训练命名实体识别器,或者我们如何注释表格数据来训练命名实体识别器。

【问题讨论】:

【参考方案1】:

您可以尝试使用 Spacy 构建客户 NER。该脚本可以根据您的需要进行调整。

Spacy NER 格式:[https://dataturks.com/help/dataturks-ner-json-to-spacy-train.php]

如果您有一个非常固定的 PDF 布局,您可以将它们转换为文本并使用此工具进行注释。这免费提供了类似于 Prodigy 的注释体验。

Doccano 注释工具:[https://github.com/chakki-works/doccano]

【讨论】:

【参考方案2】:

spacy-annotator 可以很好地解决您的问题。

它允许您使用 ipywidgets 在文本中注释自定义实体。 此外,注释器以 nlp 库 spaCy 喜欢的格式生成输出。

注解示例:

import pandas as pd
import re
from spacy_annotator.pandas_annotations import annotate as pd_annotate

# Data
df = pd.DataFrame.from_dict('full_text' : ['New York is lovely but Milan is amazing!'])

# Annotations
pd_dd = pd_annotate(df,
            col_text = 'full_text',     # Column in pandas dataframe containing text to be labelled
            labels = ['GPE', 'PERSON'], # List of labels
            sample_size=1,              # Size of the sample to be labelled
            delimiter='~',              # Delimiter to separate entities in GUI
            model = None,               # spaCy model for noisy pre-labelling
            regex_flags=re.IGNORECASE   # One (or more) regex flags to be applied when searching for entities in text
            )

# Example output
pd_dd['annotations'][0]

【讨论】:

以上是关于考勤表格中多个时间,如何分别提取上下班时间?如何计算上班时长?的主要内容,如果未能解决你的问题,请参考以下文章

如何利用Python处理考勤打卡时间数据的次数和加班时长?

如何将excel表格中多行的部分数据分别提取到另一表格中指定的多行固定位置?

如何从表中提取上下文数据来训练自定义命名实体识别器?

认识Tableau中的筛选器

php企业公司员工考勤加班系统

excel表格筛选怎么用