Git上传大文件

Posted 兵临城下也

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Git上传大文件相关的知识,希望对你有一定的参考价值。

最近开发项目中,使用了几个体积超过100M的第三方框架,这样导致在提交代码入库时,会被拒绝,以GitHub为例,单个文件超过50M入库会警告,超过100M会不然入库。

解决方案

1、将单个文件大于100M的文件不入库

GitHub官方解决方案

git rm --cached giant_file
# Stage our giant file for removal, but leave it on disk

git commit --amend -CHEAD
# Amend the previous commit with your change
# Simply making a new commit won't work, as you need
# to remove the file from the unpushed history as well

git push
# Push our rewritten, smaller commit

如果上面的没有解决,也可以使用下面的命令

git filter-branch -f --prune-empty --index-filter 'git rm -rf --cached --ignore-unmatch FrameworkFold/XXXFramework/xxx' --tag-name-filter cat -- --all

git commit --amend -CHEAD

git push

这样导致虽然可以入库成功,但是本地已经删除了这个大文件,项目运行起来还需要重新将大文件加入到项目中才行。GitHub也推荐使用 BGF

2、突破GitHub的限制,使用 git-lfs(Git Large File Storage) 支持单个文件超过100M

LFS 并不能像”变魔术一样”处理所有的大型数据:它需要记录并保存每一个变化。然而,这就把负担转移给了远程服务器 - 允许本地仓库保持相对的精简。

为了实现这个可能,LFS 耍了一个小把戏:它在本地仓库中并不保留所有的文件版本,而是仅根据需要提供检出版本中必需的文件。

但这引发了一个有意思的问题:如果这些庞大的文件本身没有出现在你的本地仓库中….改用什么来代替呢? LFS 保存轻量级指针中有真实的文件数据。当你用一个这样的指针去迁出一个修订版时,LFS 会很轻易地找到源文件(不在他上面可能就在服务器上,特殊缓存)然后你下载就行了。

因此,你最终只会得到你真正想要的文件 - 而不是一些你可能永远都不需要冗余数据。

# 1、安装git-lfs
brew install git-lfs

# 2、没有特别说明的情况下,LFS 不会处理大文件问题,因此,我们必须明确告诉 LFS 该处理哪些文件。将 FrameworkFold/XXXFramework/xxx的文件设置成大文件标示。
git lfs track "FrameworkFold/XXXFramework/xxx"

# 3、常规的push操作
git add .
git commit -m "add large file"
git push

追踪文件路径(标示大文件):

1、追踪单个文件:

git lfs track "FrameworkFold/XXXFramework/xxx"

或者修改仓库路径下的 .gitattributes 文件:

FrameworkFold/XXXFramework/xxx filter=lfs diff=lfs merge=lfs -text

2、追踪指定类型的文件:

git lfs track "*.exe"

3、追踪指定目录下的文件:

git lfs track "FrameworkFold/*"

相关知识

突破github的100M单个大文件上传限制

Git LFS 入门指南

Pro Git(中文版)

一些问题

1、Remote “origin” does not support the LFS locking API. Consider disabling it with

# 在最后一步push的时候
git push -u origin develop1.0
Remote "origin" does not support the LFS locking API. Consider disabling it with:
  $ git config lfs.https://git.oschina.net/harrydeng/xxx.git/info/lfs.locksverify false
Git LFS: (0 of 1 files) 0 B / 207.25 MB                                                                                                    
batch request: Access denied
exec request failed on channel 0: exit status 255
error: failed to push some refs to 'git@git.oschina.net:harrydeng/xxx.git'

解决方式:

git config lfs.https://git.oschina.net/harrydeng/xxx.git/info/lfs.locksverify false

2、batch request: Access denied

# 在最后一步push的时候
git push -u origin develop1.0
Remote "origin" does not support the LFS locking API. Consider disabling it with:
  $ git config lfs.https://git.oschina.net/harrydeng/xxx.git/info/lfs.locksverify false
Git LFS: (0 of 1 files) 0 B / 207.25 MB                                                                                                    
batch request: Access denied
exec request failed on channel 0: exit status 255
error: failed to push some refs to 'git@git.oschina.net:harrydeng/xxx.git'

解决方式:

# 删除 .git/hooks/pre-push 文件即可
That looks like a server issue with deploy keys. For now, try removing .git/hooks/pre-push.

3、GitHub 目前 Git LFS的总存储量为1G左右,超过需要付费。(上传失败时,可以开启VPN进行上传)

4、batch response: Repository or object not found

$ git lfs push origin master
Git LFS: (0 of 1 files) 0 B / 207.25 MB                                                                                                    
batch response: Repository or object not found: https://gitee.com/harrydeng/LargeFileStorage.git/info/lfs/objects/batch
Check that it exists and that you have proper access to it

失败原因:

是gitee.com这个git仓库并不支持lfs,所以在大文件入库的时候,提示失败

解决方式

目前来说,GitHub、GitLab、Coding。gitee(也就是git.oschina.net)目前还不支持。

以上是关于Git上传大文件的主要内容,如果未能解决你的问题,请参考以下文章

git 检出项目部分目录(稀疏检出)

Git如何检出指定目录或文件

IDEA 使用 git (码市)

Git:将子模块文件检出到单个目录中

Git 检出其它分支的某个文件

Git 检出其它分支的某个文件