今天Meta发布了首个开源的GPG-4产品Llama 3,全网震撼。
其实今天发布的是其7B和80B的模型,更厉害的400B还在路上,应该也快了。
不得不说Meta大气啊,上来就直接免费,直接怼到OpenAI的嗓子眼里,哈哈
作为用户来说,如果工作相关的产品,我是不在意付费的,但是人家提供了免费的,为啥不用呢,
今天我就从一个普通用户的角度,来试用一下刚刚出炉的llama 3
第一步
简单吧
第二步
登录facebook账户,只有登录后才能使用图像生成功能,如果只是使用对话的功能,可以跳过该步
第三步
我们先直接来试试文生图
首先让llama 3也就是meta ai来生成一只微笑的小狗,可以看到,图像的分辨率大小是 1280x1280, 一次自动给出了4张图片。
针对生成的图像,还可以进行二次编辑,当然,是通过prompt(提示语)来编辑,比如,我想要白色的小狗,MetaAI会在之前的理解基础上再加上新的要求,重新来生成(见下图白色)
然而,对于我给出的提示词, MetaAI好像并没有在原图片上修改,而是重新进行了提示词合成,变成了一个新的提示词,所以变化比较大。
另一个比较好玩的功能是,图片变动画,注意到图片下方的两个按钮没,”Animate“就是。
MetaAI会将图片一键转换成长度1.5s,分辨率512x512的视频,虽然说有点短,但是毕竟是免费的嘛😄
生成图片里面的文字
来看看llama 3能不能准确写出照片上的文字
我使用的Prompt是
can you create an image that 2 young men in black suite are leaving their work place at a building named “海港城”, sunset can be seen those skyscrapers
就这个?
整体的图片风格和意境基本符合prompt的描述,但是生成中文字得0分,还有人物的细节其实也经不起细看,这个1280x1280的分辨率基本是假的,因为放大后可以看到面部细节、手、这些地方有很多明显的错误。
会不会是因为llama 3见过的中文字太少了?
那我用英文名称来代替看看:
2 young men in black suit are leaving their work place at a building named SkyDeck, sunset can be seen those skyscrapers
看看,果然能生成英文的,单3张图片,有1张还是错的,这个也不咋地呢。
写一篇调查报告
正常的报告能力,但是,当我要求翻译成中文时,戏剧性的一幕出现了:MetaAI逐行显示出中文,我可以看到中文已经完全输出完毕了,然后,突然间中文就变成了一句话:
让人匪夷所思的是,当我问它是否懂中文时,它是肯定的,并且说它用了很多中文语料来训练,
注意,MetaAI的回答是英文的,哈哈,好分裂啊
既然这样,那我就再考考它,
看着不太识数的MetaAI还是把7言写成了8言,我也是没脾气了,毕竟AI好像都有这个毛病。
接下来我想让它帮我用上面这首诗生成对应的图片,结果它就偷懒了,说它自己只是文本型的,不是多模态的,blahblah,还说但是我可以给你描述成文字给设计师,WTF,AI偷懒摸鱼的水平也不是盖的。
我说,那你给我生成Prompt吧,这样我直接扔给文生图任务就好了,那货就给了我这个
Generate an image of a serene lake scene during the Dragon Boat Festival. In the background, feature traditional Chinese architecture and lush greenery. In the foreground, a stylized dragon boat races across the water, adorned with colorful flags and decorations. Incense sticks and traditional Chinese drums float on the water or sit on the shore. A few lotus flowers or water lilies bloom in the water. In the top-left or right corner, a small image of a happy child holding a traditional Dragon Boat Festival food, such as zongzi (sticky rice dumplings), adds a touch of joy and innocence. Use a warm color palette with shades of blue and green, accented with red and gold. Incorporate elegant Chinese calligraphy of the poem (provided below) in the design, flowing harmoniously with the scene.
Poem: 雨落江南 端午船舞 彩旗摇摆 风雨同舟 香包薰衣 雄鹰鼓响 浆酒泛舟 竞渡龙舟 绿柳依依 江水悠悠 儿童欢唱 端午快乐 龙舟竞渡 风雨同舟
Image style: Traditional Chinese painting meets modern digital art, with bold brushstrokes and vibrant colors.
既然都有Prompt了那也不差一个复制+粘贴了,来了:
还是图片里面的文字问题,看来这还不知中文呢,英文的也不好好写了。
访问因特网的能力
MetaAI能够访问因特网,这个功能不错,可以把一些实时的信息汇总进来,比如查机票,查行程
编码助手
Python代码实现
def sieve_of_eratosthenes(n):
# Create a boolean array, prime, of size n+1
prime = [True] * (n + 1)
prime[0] = prime[1] = False
# Iterate from 2 to sqrt(n)
for p in range(2, int(n ** 0.5) + 1):
# If p is prime, mark as composite all the multiples of p
if prime[p]:
for i in range(p * p, n + 1, p):
prime[i] = False
# Return a list of all prime numbers in the range [2, n]
return [p for p in range(2, n + 1) if prime[p]]
# Test the function
primes = sieve_of_eratosthenes(1000)
print(primes)
还比较容易,拿来直接运行也没有问题。
写在最后
还是我手贱了,问了一下,你到底是llama 2还是llama 3,结果它就抓马,一会说自己是基于 llama 3的,一会说是基于llama 2的,反复横跳啊,各位看官自行判断吧
are you based on llama 2 or llama 3?
are you based on llama 3 with 7B parameters or 80B or 400B?
它的回答会让你异常纠结。