考勤表格中多个时间，如何分别提取上下班时间？如何计算上班时长？

Posted 2023-05-06

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了考勤表格中多个时间，如何分别提取上下班时间？如何计算上班时长？相关的知识，希望对你有一定的参考价值。

考勤机导出的表格中，有上下班多次打卡时间，需要分别提取上午、下午的上班时间和下班时间。再分别计算多上午、下午上班时长。如图所示。

参考技术A 考勤上面多了个时间。有可能是考勤表，打错了格式。你只要每天有四次的。上下班就可以了。参考技术B 楼主您好，您说多个时间？您这是四个打卡时间啊，一般的公司四个打卡也算是正常的啊，有的是打两次卡，我没发现有什么错误，你这个提取上下班时间也很简单啊，你首先要根据公司的制度去判定，上午上班和中午下班迟到打上班卡和提前打下班卡是怎么规定的，是扣工时还是算迟到早退，明白这个了就知道怎么算了啊追问

大哥，要公式，理论出来，可是我不知道怎么用公式做

追答

现在很少手动用公式算了，考勤软件就可以自动的处理各种班次时间段了

如何从表中提取上下文数据来训练自定义命名实体识别器？

【中文标题】如何从表中提取上下文数据来训练自定义命名实体识别器？【英文标题】：how to extract contextual data from tables to train custom named entity recognizer? 【发布时间】：2019-11-18 18:41:07 【问题描述】：

我有包含表格的文档，我想提取上下文信息（例如句子或任何其他形式），以便我可以标记它们并构建命名实体识别器。

有谁知道我们如何构建上下文训练数据来训练命名实体识别器，或者我们如何注释表格数据来训练命名实体识别器。

【问题讨论】：

【参考方案1】：

您可以尝试使用 Spacy 构建客户 NER。该脚本可以根据您的需要进行调整。

Spacy NER 格式：[https://dataturks.com/help/dataturks-ner-json-to-spacy-train.php]

如果您有一个非常固定的 PDF 布局，您可以将它们转换为文本并使用此工具进行注释。这免费提供了类似于 Prodigy 的注释体验。

Doccano 注释工具：[https://github.com/chakki-works/doccano]

【讨论】：

【参考方案2】：

spacy-annotator 可以很好地解决您的问题。

它允许您使用 ipywidgets 在文本中注释自定义实体。此外，注释器以 nlp 库 spaCy 喜欢的格式生成输出。

注解示例：

import pandas as pd
import re
from spacy_annotator.pandas_annotations import annotate as pd_annotate

# Data
df = pd.DataFrame.from_dict('full_text' : ['New York is lovely but Milan is amazing!'])

# Annotations
pd_dd = pd_annotate(df,
            col_text = 'full_text',     # Column in pandas dataframe containing text to be labelled
            labels = ['GPE', 'PERSON'], # List of labels
            sample_size=1,              # Size of the sample to be labelled
            delimiter='~',              # Delimiter to separate entities in GUI
            model = None,               # spaCy model for noisy pre-labelling
            regex_flags=re.IGNORECASE   # One (or more) regex flags to be applied when searching for entities in text
            )

# Example output
pd_dd['annotations'][0]

【讨论】：

以上是关于考勤表格中多个时间，如何分别提取上下班时间？如何计算上班时长？的主要内容，如果未能解决你的问题，请参考以下文章

如何利用Python处理考勤打卡时间数据的次数和加班时长？

如何将excel表格中多行的部分数据分别提取到另一表格中指定的多行固定位置？

如何从表中提取上下文数据来训练自定义命名实体识别器？

认识Tableau中的筛选器

php企业公司员工考勤加班系统

excel表格筛选怎么用