V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
TangMonkDance
V2EX  ›  职场话题

关于转 AI 大模型的一些疑问

  •  
  •   TangMonkDance · 2023-11-13 10:51:32 +08:00 · 2166 次点击
    这是一个创建于 410 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我有近 6 年的 Java 开发经验,专业是计算机科学与技术,今年 33 岁。

    我考虑转向 AI 大模型领域,想请教一下应该学习哪些知识。我了解到一些课程好像更适合算法工程师,但我之前在学校主要学习了一些专业课,算法可能也有的,感觉目前 Java 太卷了。

    我观察到目前发展较好的领域主要有 Web3 和 AI 大模型。作为一名 Java 开发者,我想请教一下,转向这两个方向中的哪一个更适合,并且更有发展潜力。

    希望有经验的 v 友们能提供一些建议,最好能具体到书籍或课程的推荐。非常感谢!

    18 条回复    2024-01-12 17:38:37 +08:00
    murmur
        1
    murmur  
       2023-11-13 10:55:41 +08:00
    web3 国外还行,web3 在国内等同于诈骗,国外一大半等同于诈骗,剩下的在炒币
    tool2d
        2
    tool2d  
       2023-11-13 10:58:04 +08:00
    所谓 AI 大模型,感觉大家都是调用开源库,或者是微调一下模型参数,技术含量高的都是发论文的作者。

    AI 就是一阵风,要想稳定长久也不容易。还不一定有 JAVA 后端稳定。

    至于 web3 ,只有技术大牛能在行业立足,小兵接触的都是灰产。
    helone
        3
    helone  
       2023-11-13 11:03:37 +08:00
    这俩行业虽然不卷,但其实都不适合,web3 跟楼上说的情况差不多,也就几个大的交易所工作靠谱点,但是人在国内的基本也是分散式办公,工资直接发币的,大模型对学历、算法、数学要求都比较高,我感觉三十多已经是卷不了这个行业了。。。
    565656
        4
    565656  
       2023-11-13 11:20:41 +08:00
    别转 一些公司学校连跑 inference 资源都没
    vicalloy
        5
    vicalloy  
       2023-11-13 11:29:30 +08:00   ❤️ 1
    大模型卷的是算力,换句话是卷的是“钱”。
    世界范围内有能力做大模型的总共也没几个公司。
    一个大模型,核心工程师总共也要不了几个人。

    别以为大模型才刚开始,其实能入场的都入的差不多了,剩下的只是看谁能活到最后。
    vicalloy
        6
    vicalloy  
       2023-11-13 11:34:45 +08:00
    另外,现在大模型走的路和之前所谓的算法完全是两条不同的路。
    ChatGPT 出来后,传统的 NLP 基本上都可以消失了。
    zhangyichent
        7
    zhangyichent  
       2023-11-13 11:51:35 +08:00
    纯算法就算了吧,个人感觉已经过了没基础的人入行的时期了,毕竟现在科班出身的很多了,可以看看一些大模型框架,像 langchain 的那一套。
    herozzm
        8
    herozzm  
       2023-11-13 11:54:44 +08:00
    @vicalloy 但是 chatgpt 没有可以替代传统 NLP 的离线模型,调用 api 实在太贵
    bbao
        9
    bbao  
       2023-11-13 14:23:14 +08:00
    始终认为,无论任何事情如果要转一个方向,自己都没有想清楚以及了解明白,哪怕是做了,也是炮灰,无论是投资还是创业亦或是转行或者技术转型,没有内驱来解决困惑和疑问,靠外部输入的信息,就说明不合适
    hao7Chen
        10
    hao7Chen  
       2023-11-13 14:24:33 +08:00
    @zhangyichent 赞同,基于模型框架来为客户搭建定制化、私有化的大模型应用,所以用 Java 和用 Python 都差不多,而且也不必特别掌握模型算法。
    wateryessence
        11
    wateryessence  
       2023-11-13 14:26:10 +08:00 via iPhone
    cs224n ,请
    cbythe434
        12
    cbythe434  
       2023-11-13 15:12:36 +08:00
    转前端或者应用,执行最快
    算法不现实,学历背景都刷掉一大波对口专业水硕,磕磕绊绊进组都不一定能分配到卡
    Morriaty
        13
    Morriaty  
       2023-11-13 15:49:45 +08:00
    都在劝退🤣我稍微正经点吧,可以参考这个 https://gugehome.com/am.php?t=a8pslXGjYFhJ 开始入门学习。

    对于 train 和 fine tune 这条路而言,楼主想转难度挺大,需要极好的学术背景+大公司资源

    但对于 Prompt tune 这条路而言,我觉得当前还是可以尝试一下的
    love060701
        14
    love060701  
       2023-11-13 15:53:40 +08:00
    AI 大模型应用方向,JAVA 后端有发挥的场景。目前最合适的工作场景:
    love060701
        15
    love060701  
       2023-11-13 15:55:32 +08:00
    AI 大模型应用方向,JAVA 后端有发挥的场景。目前最合适的工作场景:

    调用 OpenAI API + Assistant API + Function Call + 自研服务端功能和数据维护,实现数据私有、减少幻觉、安全有效的 LLM 应用。
    TangMonkDance
        16
    TangMonkDance  
    OP
       2023-11-14 10:38:41 +08:00
    @love060701 #15 这感觉就是一般的调用三方接口呀,然后数据集中一下
    love060701
        17
    love060701  
       2023-11-14 12:42:13 +08:00 via iPhone
    @TangMonkDance 是,但是有了大模型的能力。大模型来解读用户的需求,来判断什么时候调用私有功能
    testliyu
        18
    testliyu  
       349 天前
    @Morriaty 文章是好文啊,但是这个 gugehome.com 是正经谷歌么
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5044 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 05:42 · PVG 13:42 · LAX 21:42 · JFK 00:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.