考勤表格中多个时间,如何分别提取上下班时间?如何计算上班时长?
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了考勤表格中多个时间,如何分别提取上下班时间?如何计算上班时长?相关的知识,希望对你有一定的参考价值。
考勤机导出的表格中,有上下班多次打卡时间,需要分别提取上午、下午的上班时间和下班时间。再分别计算多上午、下午上班时长。 如图所示。
参考技术A 考勤上面多了个时间。有可能是考勤表,打错了格式。你只要每天有四次的。上下班就可以了。 参考技术B 楼主您好,您说多个时间?您这是四个打卡时间啊,一般的公司四个打卡也算是正常的啊,有的是打两次卡,我没发现有什么错误,你这个提取上下班时间也很简单啊,你首先要根据公司的制度去判定,上午上班和中午下班迟到打上班卡和提前打下班卡是怎么规定的,是扣工时还是算迟到早退,明白这个了就知道怎么算了啊追问大哥,要公式,理论出来,可是 我不知道怎么用公式做
追答现在很少手动用公式算了,考勤软件就可以自动的处理各种班次时间段了
如何从表中提取上下文数据来训练自定义命名实体识别器?
【中文标题】如何从表中提取上下文数据来训练自定义命名实体识别器?【英文标题】:how to extract contextual data from tables to train custom named entity recognizer? 【发布时间】:2019-11-18 18:41:07 【问题描述】:我有包含表格的文档,我想提取上下文信息(例如句子或任何其他形式),以便我可以标记它们并构建命名实体识别器。
有谁知道我们如何构建上下文训练数据来训练命名实体识别器,或者我们如何注释表格数据来训练命名实体识别器。
【问题讨论】:
【参考方案1】:您可以尝试使用 Spacy 构建客户 NER。该脚本可以根据您的需要进行调整。
Spacy NER 格式:[https://dataturks.com/help/dataturks-ner-json-to-spacy-train.php]
如果您有一个非常固定的 PDF 布局,您可以将它们转换为文本并使用此工具进行注释。这免费提供了类似于 Prodigy 的注释体验。
Doccano 注释工具:[https://github.com/chakki-works/doccano]
【讨论】:
【参考方案2】:spacy-annotator 可以很好地解决您的问题。
它允许您使用 ipywidgets 在文本中注释自定义实体。 此外,注释器以 nlp 库 spaCy 喜欢的格式生成输出。
注解示例:
import pandas as pd
import re
from spacy_annotator.pandas_annotations import annotate as pd_annotate
# Data
df = pd.DataFrame.from_dict('full_text' : ['New York is lovely but Milan is amazing!'])
# Annotations
pd_dd = pd_annotate(df,
col_text = 'full_text', # Column in pandas dataframe containing text to be labelled
labels = ['GPE', 'PERSON'], # List of labels
sample_size=1, # Size of the sample to be labelled
delimiter='~', # Delimiter to separate entities in GUI
model = None, # spaCy model for noisy pre-labelling
regex_flags=re.IGNORECASE # One (or more) regex flags to be applied when searching for entities in text
)
# Example output
pd_dd['annotations'][0]
【讨论】:
以上是关于考勤表格中多个时间,如何分别提取上下班时间?如何计算上班时长?的主要内容,如果未能解决你的问题,请参考以下文章