2026.04.28征图日记4(leader让我开发一个iOSApp)
昨天下午要走的时候和mentor、+1、leader聊了一会,主要还是这个agent后续的事情。问题就是agent的响应太慢了,mentor在考虑如何缩短系统提示词。我当时就说可以用一个小模型管理工具,和按需加载提示词。然后leader就让我明天可以研究一下提示词工程这一块。
之后又跟mentor说到了如果你这边工作量不大的话,我就把实习生(me)调到其他地方去了。排开mentor的性格外,其实我还是挺像留在他这边的,毕竟可以学习到agent开发嘛。对秋招求职还是挺有帮助的。
上午和mentor发消息也不回,我说我应该是继续梳理代码还是去研究一下提示词工程。
mentor过了一个小时回我说他优化了一下提示词,之后把模型换成了deepseek-v4-flash现在运行飞快了。
上午还了解了一下python语法:列表,元组,字典,类,继承,装饰器,lambda匿名函数,异常处理
WC下午leader直接给了我一个新任务:开发一个ios的app,我之前哪有开发经验?
场景是:客户拿到装有app的工程机器,现场如果发现部件瑕疵,打开app拍照(选择瑕疵类型标定),上传到公司服务器
需求是:调用相机—-拍照(不存储至本地相册)—–标定瑕疵—–直接上传到服务器
移动端:
开发环境:macOS + Xcode(必须),语言 Swift。
UI 框架:UIKit(成熟稳定,相机调用文档丰富)或 SwiftUI(需 iOS 14+)。
网络请求:原生 URLSession 或第三方库 Alamofire。
最低支持系统:iOS 15.0
服务端:
语言/框架:Python 3 + Flask
数据库:SQLite(开发/初期),后可升级至 PostgreSQL
文件存储:本地磁盘(可切换至云对象存储,如阿里云)
部署方案:Gunicorn/uWSGI + Nginx,SSL 加密
还有一些需要考虑的问题:
App如何在不联网的时候暂存数据(离线、弱网处理)
服务端如何区分上传来源(上传校验,device_id)
如何在保证清晰度的前提下控制文件大小,防伪标记
图片文件命名规则
有重拍机会
服务端的数据查看后台
并发问题
日志
首先肯定是打通最小流程:点击按钮,拍照,上传,确认上传成功
之后在这个基础上添加功能,设计UI
今天下午又和mentor交流了两句,让我学一下react,后续的app开发需要用到,虽然说可以用ai,但是有些东西还是自己要会,不然AI写出bug来了你自己都不知道,然后还说了在大学都是基础,跟工作都是两码事。告诉我要确定我要做什么,确定一个方向,他之前做网页,现在做agent。感觉他还挺好的,可能是我之前太玻璃心了
今日日报:
1、继续梳理web-Ai项目代码
2、学习了解如何开发iOS APP
3、对选定的技术框架进行学习(react、react native)
4、查看react中文官方文档
下阶段计划:
1、深入学习React Native
2、配置相关开发环境
以下内容来自LinuxDo
表示边界论
定义
人工智能系统直接处理的不是现实本身,而是现实的表示。
所谓 token,在广义上指一切可被机器编码、传输、存储和运算的符号单元。
所谓 token 化,指将现实中的对象、状态、关系和过程转化为机器可处理表示的过程。
基本命题
只有进入机器表示系统的对象,才可能被人工智能处理。因而,人工智能的认知边界首先受表示边界约束。
模型本身只能执行表示变换,而不能直接触及现实。人工智能要对现实产生作用,必须借助接口、工具、传感器与执行系统形成因果闭环。
算力决定表示处理的规模、速度、成本与可持续性。
推论
人工智能能力的扩张,不只是模型能力的扩张,更是表示边界与接口边界的扩张。
多模态、工具调用、数据库连接、传感器接入,本质上都是在扩大人工智能可处理和可作用的世界。
Agent 的价值,不在于替代模型,而在于将模型嵌入现实闭环,使其从“表示变换器”变成“可作用系统”的核心部件。
这些东西我本来想写成论文,但是最近真的太忙了。CTO 说一个人自己的宝贵认知不应该随意公之于众,但是我觉得我的脑子还很新,我的认知会被自己不断推进,我不怕随时和人分享我的知识。现在模型的部署成本、能力、token的费用,还远远没有发展到极限。AI 是一个新领域,佬们,我们真正在共同构建一个全新的世界。