首页 > 解决方案 > 在 AWS Lambda 函数中使用非英文字符截断 Json 正文

问题描述

我正在使用 API 网关和 AWS Lamdba 函数作为我公司 API 的代理(C# Web API 2.0) Lambda 函数是用 Python 2.7 编写的,我正在使用 Pyhton 的 urllib2 将 http 请求传递给 API。

当我发送包含希伯来语字符的 json 正文时,我遇到了一个奇怪的问题。Json 在中间被切割。我确保从 Lambda 发送的 Json 是完整的,但是在 Lambda 中接收到的 json 主体在途中的某个地方被截断了。

这是 Lambda 函数:

from __future__ import print_function

import json
import urllib2
import HTMLParser


base = "http://xxxxxx/api"

hparser = HTMLParser.HTMLParser()

def lambda_handler(event, context):
    print("Got event\n" + json.dumps(event, indent=2))

    # Form URL
    url = base + event['queryStringParameters']['rmt']
    print('URL = %s' % url)
    req = urllib2.Request(url)
    if 'body' in event:
        if event['body']:
            print('BODY = %s' %  json.dumps(event['body'], ensure_ascii=False, encoding='utf8') )
            req.add_data(json.dumps(event['body'], ensure_ascii=False, encoding='utf8'))


    # Copy only some headers
    if 'headers' in event:
        if event['headers']:
            copy_headers = ('Accept', 'Content-Type', 'content-type')
            for h in copy_headers:
                if h in event['headers']:
                    print('header added = %s' % event['headers'][h])
                    req.add_header(h, event['headers'][h])


    # Build response
    out = {}
    headersjsonstr = ('Access-Control-Allow-Origin', '')
    response_header = {}

    try:
        print('Trying here...')
        resp = urllib2.urlopen(req)
        out['statusCode'] = resp.getcode()
        out['body'] = resp.read()
        for head in resp.info().headers:

            keyval = head.split(':')
            if any(keyval[0] in h  for h in headersjsonstr): 
                response_header[keyval[0]] = keyval[1].replace('\r','').replace('\n','').strip()

        print('response_header = %s' % response_header )
        out['headers'] = response_header
        print('status = %s' % out['statusCode'] )

    except urllib2.HTTPError as e:

        out['statusCode'] = e.getcode()
        out['body'] = e.read()
        out['headers'] = e.headers
        print('status = %s' % out['statusCode'] )

    return out

这是 Post 请求原始正文 Json

{"company":"שלום","guests":[{"fullname":"אבי","carno":"67"}],"fromdate":"2018-10-10","todate":"2018-10-10","fromtime":"07:31","totime":"07:31","comments":null,"Employee":{"UserId":"ink1445"}}

这就是我在 API 上得到的:

"{\"company\":\"שלום\",\"guests\":[{\"fullname\":\"אבי\",\"carno\":\"67\"}],\"fromdate\":\"2018-10-10\",\"todate\":\"2018-10-10\",\"fromtime\":\"07:31\",\"totime\":\"07:31\",\"comments\":null,\"Employee\":{\"UserId\":\"ink1

同样,当我只发送英文字母时,一切都很好。

请帮忙!

谢谢

标签: pythonjsonaws-lambdaurllib2

解决方案


很可能您的 json 缓冲区太小,并且您正在溢出截断。

大小可能是假设 ASCII 或 utf-8 编码设置的,并且您的 unicode 字符更宽(消耗更多字节)。

根据您使用的 json 包,您可以为 unicode 设置一个选项,或者您可能需要手动调整缓冲区大小。


推荐阅读