django - 在 Django 中批量上传 .csv 文件的最佳做法是什么?
问题描述
我有一个简单的 CSV 文件上传模块来批量上传我的 POS 数据。下面的示例代码..
模型.py
class POSData(models.Model):
outlet_name = models.CharField(...)
food_item = models.ForeignKey('FoodItem', ...)
order_date = models.DateField(...)
...
class Ingredient(models.Model):
ingredient_name = models.CharField(...)
...
class FoodItem(models.Model):
item_name = models.CharField(...)
item_key = models.IntegerField(unique=True)
...
class RecipeItem(models.Model):
food_item = models.ForeignKey(FoodItem, ...)
ingredient = models.ForeignKey(Ingredient, ...)
quantity = models.Charfield(...)
...
class POSIngredientData(models.Model):
outlet_name = models.CharField(...)
ingredient = models.ForeignKey(Ingredient, ...)
quantity = models.Charfield(...)
order_date = models.DateField(...)
...
views.py #处理.csv文件上传的代码示例
file = request.FILES['order_file']
decoded_file = file.read().decode('utf-8').splitlines()
# creating a csv dictionary reader object
csvDictReader = csv.DictReader(decoded_file, delimiter=',')
for obj in csvDictReader:
try:
food_item = FoodItem.objects.get(item_key=obj['item_key'])
except FoodItem.DoesNotExist:
# Do Something Here
pass
POSData.objects.create(food_item=food_item, ...)
recipesItemQS = RecipeItem.objects.filter(food_item=food_item)
# uploading POS data of ingredients in separate model to help in qs
# Average 10 ingredients in a foodItem recipe
for recipeItem in recipesItemQS:
POSIngredientData.objects.create(ingredient=recipeItem.ingredient, ...)
我的问题是,将所有数据上传到数据库需要太长时间(上传一行 .csv 文件需要 5-10 秒)。有没有更有效的方法从 .csv 文件上传批量数据?另外,我在某处读到应该使用Model.save()方法而不是Model.create()进行批量上传。 我不明白为什么 Model.create() 使用相同的 save() 方法。
我是 Django 新手,通过犯错和练习来学习。如果问题措辞不正确或有任何语法错误,请接受我的歉意。
解决方案
方法一:
您可以使用.bulk_create()
.
您可以先创建一个普通的 POSIngredientData 对象列表,并将其添加到 objs 参数中,.bulk_create()
如下所示
listOfPosIngredient = [POSIngredientData(ingredient=recipeItem.ingredient) for recipeItem in recipesItemQS] #Creates a list of POSIngredientData objects
POSIngredientData.objects.bulk_create(listOfPosIngredient) #Calls the bulk create method to push everything in ONE QUERY.
方法二
您还可以使用一个简洁的 django 插件,称为django-import-export,它也与 django admin 兼容。
推荐阅读
- java - 使用 Nanohttpd 进行文件传输
- screen-orientation - 检测辅助屏幕方向 Visual Basic
- c# - Thread.Sleep 和 Task.Delay 随机挂起且永不结束
- python-3.x - Python 的 lxml 忽略“minOccurs=0”
- java - JDBC 连接字符编码是如何工作的?
- java - 在 log4j.properties 中,带有空间的每日附加程序文件路径不起作用
- teamcity - Teamcity - 如何查看构建代理上的特定文件夹,但保持对 .git 的访问权限?
- gradle - Gradle - 将“编译”更改为“实现”会出错
- sap - How IDoc are stored/used in SAP
- c# - windows窗体中的TCPListener