Wassim Seifeddine
Verified Expert in Engineering
机器学习开发人员
Wassim是一名拥有7年以上经验的软件工程师,其中包括4年以上的机器学习经验. 他与各种各样的客户合作,从初创公司到研究机构再到跨国公司. Wassim从人群中脱颖而出,因为他对构建适应业务需求的可伸缩解决方案了如指掌.
Portfolio
Experience
Availability
首选的环境
PyTorch, PySpark, NumPy, Jupyter Notebook, Pandas, 亚马逊网络服务(AWS), GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Computer Vision, Python, 人工智能(AI), GPU Computing
The most amazing...
...我所建立的项目是一个法律案例分类模型, 对案例描述进行分类并突出显示关键文本元素的系统.
Work Experience
机器学习工程师
Animaj
- 培养从文本中提取概念的能力, audio, 以及视频内容,以便更好地了解社交媒体趋势. 概念包括情感、活动和对视频中发生的事情的看法.
- 开发了一套Apache气流定向无环图(dag),用于编排数据和机器学习(ML)管道.
- 创建了一个监控系统,以鸟瞰整个系统.
- 微调LLMS (gptj), gpt-neox, llama)使用内存和LoRA等省时技术来处理新数据集, DeepSpeed ZeRO, 和PyTorch的FSDP.
- 生成2D/3D图像和视频使用稳定扩散和其他生成AI模型微调自定义数据集.
- 在量化模型方面有丰富的经验(研究和工业),以提高训练和推理的效率.
- 在使用gRPC服务器和网状网络的分散网络上部署llm.
AI/ML Expert
1Bstories
- 开发了一个系统,生成基于多个用户选择的逼真的虚拟人物与TTS模型一起使用.
- 建立了一个场景生成管道,根据特定的描述和偏好生成图像.
- 将MLflow部署到生产环境,以监控所有正在进行的机器学习模型推断.
AI/ML Specialist
富柠檬应用程序FZE有限责任公司
- 训练AI模型生成特定风格的用户头像,同时保留面部特征.
- 与之前使用Dreambooth的方法相比,取得了显著的改进, 导致头像与原始面孔非常相似.
- 运用强大的AI/ML知识, Python, LoRA, diffusion models, stable diffusion, 和图像处理来完成项目目标.
机器学习工程师
火星学习公司.
- 帮助调试自定义深度学习模型的评估问题.
- 与一组人工智能研究人员一起调试模型路由器的性能.
- 在GPU集群上运行模型进行训练和评估.
机器学习工程师
Odem全球有限公司
- 微调llm以部署到分散的区块链.
- 开发了一个gRPC服务器,将推理卸载到远程服务器.
- 提高了先进llm的推理速度,以便部署在资源受限的服务器上.
AI Developer
CodeComplete, Inc
- 从事因果语言模型加速的优化.
- 探索新概念,利用该领域最先进的技术来提高性能.
- 进行深入的分析和实验,以确定潜在的瓶颈,并开发创新的解决方案,以优化语言模型的性能.
- 了解语言建模领域的最新进展,探索其适用性,进一步提高因果语言模型的加速和整体效率.
OCR AI Developer
ACFT PERFO
- 实现了一个使用AWS extract从PDF文件中提取结构化数据的解决方案.
- 开发端到端管道,用于提取数据并将其保存到数据湖中.
- 提供替代解决方案和工具,以提高数据提取过程的效率和准确性.
高级AI b|技术b|人力资源顾问
Block Born LLC
- 为AI工具提供建议,根据模式和规模为游戏内容生产提供创造性建议.
- 审查并提供与实施AI工具有关的创意内容建议的反馈.
- 在人工智能及其在创意内容生成中的应用方面表现出深厚的专业知识.
机器学习工程师
广告营销有限责任公司
- 为社交媒体优化产品广告算法.
- 研究改进视频产品植入的技术.
- 探索视频生成建模的深度学习技术.
具有GPT-2/3技能的机器学习工程师
Toptal
- 训练了一个gpt风格的模型,用于部署在位张量网络上的简单语言建模.
- 配置一个迭代过程,从以前的检查点在新数据集上训练模型.
- 在培训期间和培训后监控模型的性能,以了解何时需要重新培训.
首席机器学习工程师
Quantum Analytica
- 曾在一家房地产初创公司担任创业顾问,帮助他们更好地了解数据基础设施,并指导他们使用ETL管道使用正确的工具, data lakes, delta tables, and hot storage.
- 开发了一套完整的PySpark etl用于转换, cleaning, 对来自不同数据源和行业的数据进行规范化, 包括房地产和农业.
- 使用来自不同提供商的客户级数据和奖励数据,为一家早期初创公司构建了一个个性化的基于机器学习的员工奖励模型,作为MVP.
- 管理技术团队,包括为整个团队设计架构. 架构范围从带有动态代理的web抓取器到热存储数据, 准备好被REST api使用.
- 为零售领域的消费者需求预测者开发机器学习模型,专注于优化分销以避免缺货.
- 研究一种算法,用于预测消费者对特定产品的需求,以帮助我们的客户战略性地进入新市场.
PhD Researcher
Nantes Université
- Worked on my Ph.D. 用计算机算法研究神经网络的加速问题.
- 设计新的神经网络训练策略,鼓励低精度的神经网络有更好的表现.
- 为低级操作和功能近似开发自定义CUDA操作.
- 参加与机器学习和计算机算术相关的会议和研究学校.
Research Intern
Inria
- 参与一个研究项目,使用早期退出网络在小型资源受限设备上运行大型机器学习模型.
- 与两位教授合作,对模型压缩技术进行文献综述, 包括量子化, pruning, 知识的提炼.
- 在一个国际会议上发表论文,并在会上介绍工作成果.
机器学习工程师
Navya
- 使目标检测模型更快,更轻,能够在伪实时运行中部署在自动驾驶汽车上.
- 与核心机器学习团队密切合作,以确保我们在实验设置和结果上保持一致.
- 尝试了多种模型压缩策略,如修剪, quantization, 并编制评价各方法的有效性.
- 将模型压缩约4倍,推理速度提高3倍,同时保持与原始模型相同的性能.
Data Scientist
SannSyn
- 开发了一个系统,可以根据行业专家输入的原始文本对法律案件进行分类. 给出的数据是从在线资源中提取的原始数据和OCR pdf.
- 对非结构化数据进行数据分析,以了解如何处理数据以及提高质量所需的流程.
- 建了一个刮网器来刮财经新闻.
- 使用基于转换器的模型为财经新闻文章提供情感分析功能.
机器学习工程师
Tedmob
- 使用RASA AI开发面向客户的聊天机器人, Dialogflow, 以及Microsoft bot框架,用于一家领先的电信运营商,用于处理常见问题和与OTP身份验证和第三方集成相关的帐户问题.
- 使用各种工具实时跟踪问题,如Sentry、ELK stack和Docker监控工具.
- 处理与客户的会议,并收集各种团队需求,以达到最佳的发布过程.
iOS部门负责人
Tedmob
- 领导和监督iOS开发团队两年.
- 管理新员工的招聘和入职流程.
- 迁移团队技术栈并合并新的软件架构.
iOS Developer
Tedmob
- 为从个人创业公司到跨国公司的客户开发商业应用程序.
- 实时跟踪应用程序端发生的问题,并在下一个版本中解决它们.
- 将旧的应用程序从Objective-C迁移到Swift.
Experience
从视频中提取概念
这些概念包括:
• Emotions
• Activities
• Sentiment
• Objects
• Movement
目标检测的量化神经网络
使用的模型是ImageNet上带有SSDLite对象检测器的MobileNetV2预训练模型. 我们以FP32数据格式训练模型.
我应用了几种模型压缩技术来减小模型的大小并监控其性能.
我们使用的一些方法是:
• Quantization
• Pruning
•融合卷积
•知识蒸馏
这项工作的结论是,该模型可以可靠地检测图像中的物体,其精度与FP32版本相同,同时可以低至INT8数据格式.
随意语言模型微调
法律案件分类
•对非结构化的凌乱文本数据进行EDA,以了解如何处理这些数据
•建立一个模型,根据输入的描述将法律案件分为几个类别. 这一部分的目的是提供一个工具,帮助律师更快更容易地分类案件.
•从案例描述中提取与分类相关的实体,以帮助反驳.
自定义语言模型培训框架
http://github.com/pegesund/nor_bert多模态文本分类器
推特情绪分析
在边缘设备上运行神经网络
http://ieeexplore.ieee.org/abstract/document/9664700挪威情绪分析模型
• Positive
• Neutral
• Negative.
主要的困难是找到一个好的挪威语标记情感分析数据集,并对现有的多语言模型进行微调.
Skills
Languages
Python, Python 3, Bash, SQL, Snowflake, c++, Swift
Libraries/APIs
PyTorch, NumPy, Pandas, Matplotlib, XGBoost, PySpark, TensorFlow, OpenCV, REST APIs, Scikit-learn, YouTube API, cuBLAS
Paradigms
数据科学,移动开发,ETL,应用程序开发,分布式计算,实时系统
Platforms
Jupyter Notebook, Docker, Databricks, 亚马逊网络服务(AWS), Embedded Linux, iOS, AWS Lambda, NVIDIA CUDA, Blockchain, Microsoft Edge, 谷歌云平台
Storage
NoSQL, MySQL, Amazon DynamoDB,数据湖,Amazon S3 (AWS S3)
Other
Machine Learning, Computer Vision, Sentiment Analysis, Deep Learning, 自然语言处理(NLP), 人工智能(AI), Image Processing, OCR, 计算机视觉算法, 移动应用开发, 预测建模, Algorithms, APIs, Data Analytics, Data Visualization, Forecasting, AI Design, Data Engineering, 深度神经网络, Data Analysis, CTO, 预测分析, Statistics, Datasets, Causal Inference, Fine-tuning, Data Inference, Programming, Architecture, Analytics, Image Recognition, API Integration, GPT, 生成预训练变压器(GPT), 软件架构, 图形处理器(GPU), 卷积神经网络, Image Analysis, GPU Computing, 云架构, Models, Optimization, Consulting, Advisory, 技术咨询, Startup Consulting, Facial Recognition, OpenAI, GPT-Neo, 谷歌发布者标签(GPT), DeepSpeed, Text Generation, Speech Recognition, Web Development, 手写识别, 大型语言模型(llm), Data Management, Stable Diffusion, ControlNet, 机器学习操作(MLOps), 数据驱动营销, 生成预训练变压器3 (GPT-3), OpenAI GPT-4 API, Research, Graph Theory, Arithmetic, Object Detection, Neural Networks, Slurm工作量管理器, Chatbots, 推荐系统, Quantization, Data Scraping, Clustering, 文本分类, 物联网(IoT), Language Models, Data Warehousing, Trend Forecasting, Topic Modeling, 收入预测, Video Analysis, Speech Synthesis, Sound, Text Animation, Diffusion Models, Image Generation, 定量金融学, Object Tracking, Generative Models, ChatGPT, Plugins, GPT-4, OpenAI GPT-3 API, Amazon Textract, Youtube Ads, Videos, LoRa, Flash Attention, Pricing Models, DreamBooth, Kohya, Wearables, Biometrics, 强化学习, Text to Image, Text to Video, MLflow, Midjourney, Avatars
Frameworks
Apache Spark, Spark, Flask, gRPC
Tools
Amazon EKS, Xcode, Jira, Jupyter, Apache Airflow, AWS ELB, Amazon弹性容器服务(Amazon ECS), AWS Fargate, Amazon SageMaker
Industry Expertise
项目管理
Education
计算机科学博士学位
南特大学-南特,法国
人工智能硕士学位
ESIEE巴黎-巴黎,法国
计算机科学学士学位
黎巴嫩大学-贝鲁特,黎巴嫩
Certifications
深度学习专业化
DeepLearning.ai | via Coursera
高级机器学习专业化
DeepLearning.人工智能和斯坦福在线b|通过Coursera
Machine Learning
斯坦福大学b|通过Coursera
iOS开发者
Udacity